Les internautes ne connaissent pas la face cachée du net, le « Deep Web » qui n’est pas indexé par les moteurs de recherche. La DARPA a créé Memex pour explorer ce monde souterrain.
Tout le monde connait internet, ce qui ne signifie pas connaitre « tout » le web. « Certains estiment que Google, Yahoo et Bing ne donnent accès qu’à environ 5% du contenu sur le web », souligne Chris White, de la Defense Advanced Research Projects Agency (DARPA). Le reste du net est non indexé, c’est ce que certains appellent le « Deep Web » ou « Dark Web ».
C’est pour explorer cette face cachée du net que la DARPA a créé Memex, un moteur de recherche capable de trouver les contenus non indexés d’internet. Cet outil comme un moteur de recherche classique pour classifier les pages selon certaines propriétés. Par contre, il utilise le Big Data pour référencer les informations qu’il contient.
Plus qu’un simple moteur de recherche, Memex est aussi capable de cartographier certains contenus ou d’identifier des personnes, par exemple pour tracer l’origine de certaines publications, en remontant des informations telles que l’adresse IP, une adresse e-mail, un numéro de téléphone, etc.
Chris White tient à rassurer au sujet de Memex. Cet outil n’a pas pour vocation de désanonymiser ce qui est anonyme sur internet. Son but est d’être utilisé par les forces de l’ordre pour traquer des criminels. Memex a d’ailleurs déjà été utilisé aux États-Unis pour lutter contre la prostitution : lors du dernier Super Bowl, l’outil a repéré les annonces cachées liées à la prostitution, identifié les lieux, les adresses IP, etc., dans le but de suivre les mouvements des prostituées.