On vient d’apprendre que Google utilise un nouvel algorithme d’intelligence artificielle dans son moteur de recherche, une technologie baptisée RankBrain. Que sait-on à son sujet ?
C’est lundi qu’une nouvelle a pointé le bout de son nez, le fait que Google utilise désormais du machine learning dans son algorithme de recherche, un système d’intelligence artificielle appelé RankBrain. Comment cela fonctionne-t-il, quel est son influence sur le classement, etc., de nombreuses questions se posent. Voilà ce que nous savons pour le moment.
Les réponses qui suivent sont un condensé d’informations provenant de trois sources : de Bloomberg qui a annoncé l’existence de RankBrain, de Google qui a donné quelques explications au Search Engine Land, et finalement les meilleures hypothèses sur ce qu’aurait pu mettre en place le moteur de recherche.
Qu’est-ce que RankBrain ?
RankBrain est le nom donné par Google à son système d’intelligence artificielle d’apprentissage automatique utilisé dans le processus de recherche. La firme de Mountain View a d’ailleurs confirmé le nom.
Qu’est-ce que l’apprentissage automatique ?
L’apprentissage automatique est un algorithme qui permet à un ordinateur d’apprendre par lui-même.
Qu’est-ce que l’intelligence artificielle ?
L’intelligence artificielle, ou AI, est un ordinateur qui est censé être aussi intelligent qu’un être humain, en tout cas au niveau de l’acquisition de la connaissance. Sa principale faculté est de pouvoir utiliser les données qu’il a à disposition pour trouver de nouvelles connexions.
L’AI est très populaire dans les romans de science-fiction. Dans la réalité, on n’en est pas encore au même stade. Cette technologie est surtout utilisée pour faire référence à des systèmes informatiques capables d’apprendre et d’établir des connexions.
En fait, dans le cas de RankBrain, les termes apprentissage automatiques et intelligences artificielles sont très proches.
RankBrain est la nouvelle méthode de Google pour classer les recherches ?
En fait non. L’algorithme Google global search est un programme qui utilise de nombreux outils pour trier les milliards de pages d’internet dans le but de trouver les pages les plus pertinentes lors d’une recherche. RankBrain n’en est qu’une partie.
Pendant de nombreuses années, l’algorithme Google global search n’avait pas d’appellation officielle. Mais depuis mi-2013, il est connu sous le nom de Hummingbird.
Vu que Bloomberg indique clairement que RankBrain ne gère pas toutes les recherches, comme le ferait seulement l’algorithme global, il est donc clair que ce nouvel algorithme n’est qu’un des outils utilisés par le Google global search.
On peut d’ailleurs rappeler qu’au même titre que RankBrain, Panda, Penguin et Payday sont d’autres outils utilisés par l’algorithme global.
Qu’est-ce que Google utilise pour le classement ?
Pour déterminer comment classer les pages internet, Google utilise des « signaux », par exemple les mots en gras sur une page qui sont comptés dans le but de définir un PageRank, c’est-à-dire une sorte de score. Si la page est dans un environnement mobile, c’est un autre signal qui est utilisé. Etc.
Ce sont ainsi de très nombreux signaux qui sont utilisés par les différents algorithmes pour, au final, trouver les meilleurs résultats aux requêtes de recherche.
Selon ce que Google a annoncé, il y aurait plus de 200 signaux importants et jusqu’à 10 000 variantes secondaires.
Selon l’article de Bloomberg, RankBrain serait devenu le troisième signal le plus important pour le classement des pages web.
Vu que RankBrain est troisième, on peut se poser la question de savoir quels sont les deux premiers signaux ? La réponse à cette question est qu’on ne le sait pas ! En effet, Google n’a jamais accepté de livrer cette information. Il pourrait s’agir des liens et des mots clés, mais cela reste à démontrer.
Quelle est l’utilité de RankBrain ?
Le moteur de recherche traite avant tout des requêtes sur la base des mots exacts contenus dans la demande. Sans que l’on sache véritablement sûr pour le moment, RankBrain pourrait servir à faire des recherches avec d’autres mots… similaires.
Google Search était déjà capable de savoir que « sabot » peut aussi signifier « soulier », que « fonctionner » peut dire « exécuter », etc. Alors, qu’apporte réellement RankBrain ? Vu l’intelligence artificielle doit est dotée cet outil, son machine learning, son but est certainement d’apprendre d’autres liens.
Comme l’avait précisé Google en 2013, environ 15% des requêtes qui sont faites n’ont jamais été faites auparavant, soit des centaines de millions de nouvelles requêtes chaque jour. Justement, RankBrain cherche à améliorer ces nouvelles requêtes.
L’utilisation du machine learning servant bien évidemment à comprendre les nouvelles requêtes dans le but de prévoir les requêtes de demain.
Un exemple serait le bienvenu pour comprendre comment cela fonctionne. Mais voila, Google n’en propose aucun. L’article de Bloomberg en donne un, celui du niveau le plus élevé de la chaîne alimentaire.
Deux requêtes, « Quel est le nom du prédateur au plus haut niveau de la chaine alimentaire » et « le sommet de la chaine alimentaire », devraient normalement donner les mêmes résultats vu que la requête est similaire. Ce n’est pour le moment pas le cas. C’est à ce stade que RankBrain devrait intervenir pour trouver des liens entre ces deux requêtes.
Est-ce que RankBrain va vraiment aider ?
Vu l’importance du signal de RankBrain, l’importance de cet algorithme est énorme. Pour l’heure, vu qu’il est encore en phase d’apprentissage, il est par contre possible que son utilité ne soit pas évidente. Avec le temps, on devrait noter des changements.
Quand est-ce que RankBrain a démarré ?
Selon Google, le déploiement de RankBrain a été graduel. Il aurait démarré au début 2015 et serait désormais pleinement opérationnel dans le monde entier.
Quel est l’impact de ce nouvel algorithme ?
Bien que Google ait indiqué à Bloomberg qu’« une très grande partie » des requêtes est traitée par RankBrain, aucun chiffre précis n’a été donné par la firme de Mountain View. De fait, on n’a aucune idée de son impact réel pour le moment.
L’apprentissage continu
L’intelligence artificielle de RankBrain fait que le système va continuer à apprendre. Comment ? Le site https://opensource.googleblog.com/2013/08/learning-meaning-behind-words.html nous explique justement comment des mots et des phrases peuvent être mathématiquement connectés, par exemple pour trouver le concept de capitale d’un pays simplement en scannant l’actualité.
Au final, RankBrain est un gros changement dans l’algorithme de recherche de Google, un changement qui est pour le moment encore bien mystérieux.