Qu’est-ce que Google Penguin ?

mars 24, 2021
lsandil
La création de Google Penguin
Pour commencer, mettons un terme au débat « Google Penguin ou Google Pingouin ? ». Oui, nous sommes en France, mais la firme est américaine et il s’agit d’un nom propre, d’une marque. Ainsi, pas plus qu’on ne parle d’iTéléphone, nous parlerons Google Penguin. Mais libre à vous de voir les choses autrement.
Quoi qu’il en soit, Penguin est le petit frère de Panda. Il s’agit de deux filtres utilisés par le célèbre moteur de recherche, ou plutôt par son algorithme, PageRank. Pour être encore plus exact, il est en réalité question de deux mises à jour majeures. Toutes deux ont eu pour but de nettoyer l’index Google en identifiant puis en pénalisant les sites qui ne respecteraient pas ses fameuses Guidelines.
En effet, Google s’est rapidement aperçu que de nombreux sites exploitaient les failles de son algorithme pour améliorer leur référencement naturel. C’est pourquoi, après avoir fait la chasse aux sites pauvres en contenus et au plagiat en 2011, le moteur de recherche s’est ensuite attaqué dès 2012 à tous ceux usant de techniques frauduleuses pour grimper dans les résultats.
Son fonctionnement
L’algorithme ovipare chasse les tricheurs : tous ceux qui auraient recours dans leur stratégie de référencement naturel à des méthodes pointées du doigt dans les Guidelines. Ainsi, dès 2012, les crawlers, qu’on appelle également Google Bots, ont été chargés de faire particulièrement attention à certains détails autrefois oubliés. Voici quelques-unes des techniques traquées par le géant américain pour lutter contre référencement abusif :
Le bourrage de mots-clefs :
Méthode aujourd’hui quasiment obsolète, elle consiste à intégrer un grand nombre de mots-clefs sur une page, même sans rapport direct avec son contenu. Pire encore, il y a bien longtemps, certains webmasters n’hésitaient pas à écrire des lignes entières de mots-clefs avec une couleur de police identique à celle du fond…
Le cloaking :
Plus récente, mais surtout plus élaborée, cette approche nécessite un peu plus de technique. Il s’agit de repérer parmi les visiteurs d’un site tous les robots envoyés par les moteurs de recherche. Grâce à leur adresse IP, ces derniers sont automatiquement renvoyés vers une version différente de celle présentée aux visiteurs humains.
La duplication de contenu :
Comme son nom l’indique, il s’agit de reproduire partiellement ou intégralement un contenu déjà existant. Il ne s’agit pas là d’améliorer son référencement, mais cela détériore la qualité de l’expérience des visiteurs. C’est pourquoi Google sanctionne également ce type de pratique.
Le netlinking :
Là encore, des abus ont existé. Le netlinking a était blacklisté par google, non pas par sa nature puisque nécessaire pour assurer le bon fonctionnement de leurs crawlers, mais par sa façon de faire. En effet, il existe ce que l’on appelle des « fermes de liens », des sites exclusivement dédiés à la création de backlinks pour un site tiers, on parle alors de « Money site ». Aujourd’hui Penguin sert à détecter des sites de mauvaise qualité, crées de manière artificielle. De ce fait, un site possédant de plus en plus de liens et ce de façon exponentielle en provenance de ce type de site pourrait ainsi mener Google à le blacklister.
Les pénalités de Google Penguin
Bien entendu, une fois que l’algorithme vous a identifié comme fraudeur, c’est la sanction. Tout d’abord, il existe deux types de pénalités. Les pénalités automatiques, gérées par les robots, et les pénalités manuelles. Ces dernières résultent généralement d’une anomalie signalée par l’un des crawlers. S’ensuit une vérification minutieuse, effectuée l’un des membres de l’équipe de contrôle, afin de déterminer s’il y a lieu ou non d’appliquer une sanction.
Il n’y a que dans le second cas de figure qu’une réclamation est possible. Lors des sanctions dites « manuelles », le propriétaire reçoit un message de la partie Google lui expliquant pourquoi il a été puni. Ce dernier peut alors corriger ce qui faisait défaut et demander ensuite à faire examiner son site de nouveau.
Les sanctions peuvent varier de quelques places perdues sur une requête, à la désindexation d’une ou plusieurs pages, voire parfois de la totalité d’un site. C’est dire si Google plaisantait lorsqu’il a présenté son ambition de mener une politique de « Fear Uncertainty and Doubt ».