Comment fonctionne un algorithme de Learning to rank ?

Pour comprendre plus en détail le fonctionnement du moteur de recherche de Google, nous allons étudier dans ce cours le fonctionnement d’un algorithme de learning to rank pour comprendre la manière dont les classements se construisent et évoluent.

Temps de lecture estimé : 4 minutes

Sommaire afficher

À quoi sert le learning to rank?

Tout d’abord, rappelons qu’un moteur de recherche n’est pas capable de savoir si un contenu répond à une intention de recherche.

Cette capacité revient à l’humain qui consulte le contenu et qui estime s’il est satisfait ou non par la réponse proposée.

Un algorithme de learning to rank consiste donc à « apprendre à classer » les résultats en fonction du comportement des internautes avec les résultats proposés par le moteur de recherche.

À noter que ce processus d’amélioration dépend grandement de son nombre d’utilisateurs.

Si 2 moteurs de recherche utilisent les mêmes algorithmes, mais que l’un est nettement plus utilisé que l’autre, alors ses résultats seront meilleurs.

Comment fonctionne le learning to rank ?

Afin de classer les résultats d’une requête, les moteurs de recherche utilisent des centaines de signaux différents.

Mais tous ces signaux n’ont pas la même pertinence selon les différentes typologies de recherche.

Par exemple, pour des requêtes en lien avec l’actualité, la date de publication du contenu est très importante, alors que pour une recherche commerciale, la date de publication a cette fois peu d’importance tandis que les avis des clients quant à eux sont très importants.

La pondération de ces signaux est alors subjective à des familles de requêtes similaires.

L’une des principales avancées dans ce processus de pondération, est l’application de la descente de gradient sur des réseaux de neurones.

Un « réseau de neurones » consiste à découper finement un calcul en une multitude de sous-calculs effectués par les « neurones » qui sont regroupés par couches.

Le processus de calcul se propage alors à travers les couches de neurones qui reçoivent une valeur d’entrée, effectuent un calcul et donnent un résultat qui sert d’entrée au neurone de la couche suivant et ainsi de suite jusqu’à obtenir le résultat final.

Schéma du fonctionnement d’un réseau de neurones ayant 2 couches.

En effet, lorsque le classement des résultats obtenus ne correspondent pas à l’attendu.

Un processus de machine learning effectue une rétropropagation du gradient au sein du réseau de neurones, en limitant les risques d’erreurs grâce à une évolution qui se fait petit à petit, jusqu’à répondre de la meilleure façon possible à l’intention de recherche.

Une rétropropagation du gradient consiste à corriger les pondérations des calculs effectués en partant de la dernière couche de neurones (celle qui donne le résultat final), pour ensuite remonter couche après couche jusqu’à la première, afin que la suite de calculs fournisse le résultat attendu.

Comment l’algorithme analyse le comportement des utilisateurs ?

La prise en considération du comportement de l’utilisateur face à la liste des résultats proposés, consiste à se poser certaines questions :

Est-ce que l’utilisateur revient sur la liste des résultats après avoir cliqué sur l’un des liens ? (on parle alors de « pogosticking »)
- Cela pourrait indiquer un manque de pertinence de la pondération des signaux pour répondre à l’intention de recherche.
Est-ce que l’utilisateur a reformulé sa question après être revenu ?
- Cela pourrait indiquer que la requête initiale ne semble pas exprimer correctement le besoin informationnel et qu’elle devrait être reformulée automatiquement.
Etc.

Et pour répondre à ces questions les moteurs de recherche peuvent utiliser des indicateurs tels que :

La cohérence des taux de clics par rapport au classement proposé.
Le temps rétention des internautes sur les pages proposées en résultats de recherche.
Etc.

Toutes ces données permettent à l’algorithme de nourrir son processus de machine learning en continu.

C’est pourquoi, il est nécessaire en SEO de cherche à améliorer ses taux de clic dans les résultats de recherche et réussir à retenir les internautes sur son site.

Auteur : Thomas Viennet - Freelance SEO
Dernière mise à jour : 4 février 2024

Vous êtes ici : Référencime > Formation SEO gratuite en ligne certifiante pour Google > Comment fonctionne un moteur de recherche ? > Comment fonctionne un algorithme de Learning to rank ?

Principales sources d’informations

Learning to Rank using Gradient Descent (2005) par Chris Burges, Tal Shaked, Erin Renshaw, Ari Lazier, Matt Deeds, Nicole Hamilton et Greg Hullender.
TF-Ranking: Salable TensorFlow Library for Learning-to-Rank (17/05/2019) par Rama Kumar Pasumarthi, Sebastian Bruch, Xuanhui Wang, Cheng Li, Michael Bendersky, Marc Najork, Jan Pfeifer, Nadav Golbandi, Rohan Anil et Stephan Wolf.
Formaseo Niveau 2 : Algorithmie des moteurs de recherche (Décembre 2020) par Guillaume et Sylvain Peyronnet, experts incontournables du domaine, fondateurs de yourtext.guru et babbar.tech.

Menu de la formation 🧗

Sous-chapitres de « Comment fonctionne un moteur de recherche ? » :

Chapitres de la formation SEO gratuite :

5/5 - (4 votes)