Google est un moteur recherche dont l’objectif ultime est de trouver les pages Web les plus pertinentes correspondant aux requêtes formulées par les internautes. Pour proposer des résultats appropriés aux recherches des internautes, Google procède en 3 étapes : le crawling (visite des pages), l’indexation (stockage des pages crawlées dans les serveurs de Google) et finalement proposer des résultats qui lui semblent les plus adéquats en réponse à la requête des internautes.
Google utilise plusieurs algorithmes pour améliorer la pertinence de ses résultats, toutefois certains algorithmes ont des fonctions plus spécifiques. Comme, par exemple, sanctionner les sites qui ont des pratiques qui consistent à tromper les crawlers.
Les principaux algorithmes de Google
L’algorithme Google Panda
Opérationnel depuis 2011, cet algorithme a été créé pour détecter les pages Web qui représentent peu d’intérêt par rapport à la demande des internautes : pages de contenu de peu de qualité, insuffisamment informatives avec peu de texte, pages dupliquées (duplicate content) ou plagiées.
L’algorithme Google Penguin
Cet algorithme a été lancé en 2012 pour repérer les sites suroptimisés. Il permet notamment de filtrer les pages contenant des backlinks (liens entrants) de faible qualité visant à fausser les résultats de recherche. Pour éviter d’être sanctionné, il convient de miser sur des liens de qualité plutôt que sur la quantité. L’ancre de liens (le texte sur lequel est inséré un lien) est également importante pour juger de la qualité du lien. Celui devrait est en accord avec la thématique de la page pointée et devra être rédigé de façon explicite mais non pas sous forme de « mot clé », comme par exemple « Livre blanc pour tout savoir sur le Content Marketing plutôt que « livre blanc Content Marketing ».
L’algorithme Google Hummingbird (Colibri)
« Hummingbird » est né en 2013 dans l’objectif de proposer des résultats aux plus près de la recherche et le besoin des internautes. Il se concentre notamment sur les recherches conversationnelles, c’est-à-dire les requêtes formulées sous forme de phrase ou de question et qui sont très ciblées (longue traîne). Après une analyse sémantique poussée de la requête, cet algorithme cherche à comprendre l’intention de l’internaute pour lui proposer les contenus de qualité.
RankBrain
Cet algorithme est un véritable système d’Intelligence Artificielle (IA). Il permet de répondre de manière la plus précise possible aux requêtes complexes et très spécifiques (très peu ou pas du tout recherchées). C’est un algorithme basé sur le Machine Learning qui consiste à la capacité de la machine d’apprendre par elle-même en analysant le comportement des internautes. Par exemple, un internaute formule une requête, Google lui propose des résultats qui lui semblent les plus pertinents. L’internaute clique sur certains résultats, reste plus ou moins longtemps sur une page, puis il revient sur la liste des résultats et choisit un autre lien et quitte la page associée aussitôt etc… RankBrain apprend du comportement de l’internaute, et si un autre internaute formule la même requête, il propose des résultats en tenant compte de ce qu’il a appris auparavant !
L’algorithme Bert
Lancé très récemment, en octobre 2019, Bert complète et renforce RankBrain. En effet, il s’agit aussi d’une intelligence artificielle capable de comprendre le langage naturel, notamment quand les recherches sont exprimées avec des phrases longues. Auparavant, Google se contentait de se concentrer sur les mots clés employés dans les requêtes, les éléments grammaticaux étaient totalement ignorés. Bert, en revanche, tient compte des prépositions (comme « à », « pour » etc.) et par conséquent il sélectionne des résultats plus appropriés à l’intention de l’internaute.