Alors qu’il est estimé que les moteurs de recherche habituels indexent 5% du web, Memex est capable d’explorer les tréfonds d’internet.
« Certains estiment que Google, Microsoft et Yahoo ne nous donnent accès qu’à 5% du contenu du Web », explique Chris White, ingénieur à la DARPA, la branche de l’armée américaine spécialisée dans les réseaux. En fait, il existe un web invisible, le « Deep Web », plus vaste que ce que nous montrent les moteurs de recherche habituels.
Ce Deep Web se compose des pages non indexées par les moteurs, typiquement des pages éphémères, des sites à faible trafic encore ou des pages protégées par un logiciel spécifique tel que Tor. Ces pages sont une sorte de monde parallèle où agissent des différents réseaux criminels. Pas moins de 60 millions de pages de ce genre auraient été mises en ligne ces deux dernières années selon la DARPA.
Dans le but de pouvoir explorer les tréfonds du web, la DARPA a conçu Memex, un système qui applique les principes du Big Data pour indexer le Deep Web. Capable d’indexer le web invisible, Memex a pour but d’aider les enquêteurs à traquer les activités illégales telles que le trafic de drogue, la prostitution ou encore la pédophilie.
Bien que potentiellement capable de collecter des données personnelles, la DARPA précise que ce nouveau moteur de recherche ultra-puissant n’a pas l’intention de le faire.
Hormis la traque de la criminalité, Memex pourrait avoir d’autres débouchés, comme par exemple suivre l’évolution d’une pandémie par exemple.
Une chose est en tout cas certaine, l’existence de Memex nous rappelle le programme de surveillance Prism. Est-ce que l’histoire va se répéter ?