Penguin (Google)
Penguin (ou Google Penguin) est le nom de code[1] d'une mise à jour de l'algorithme PageRank de Google qui a été annoncée le [2].
La mise à jour avait pour objectif de réduire le positionnement des sites Web qui violaient les Google’s Webmaster Guidelines [3] en utilisant des techniques de référencement abusif (spamdexing), tels que le keyword stuffing[4], le cloaking[5], la participation à des échanges de liens[6], la duplication délibérée de contenu[7] et autres.
Nom de la mise à jour
La mise à jour Penguin a été introduite le . Google ne lui a donné un nom officiel que 2 jours plus tard[1].
Effets de penguin sur les résultats du moteur de recherche
Selon les estimations de Google[2], Penguin touche environ 3,1 % des requêtes en anglais et environ 3 % des requêtes dans des langues comme l'allemand, le chinois et l'arabe. L'impact est plus grand pour les langues où le référencement abusif est plus fréquent.
Différences entre Penguin et les mises à jour précédentes
Avant Penguin, Google a publié des mises à jour de son algorithme PageRank sous le nom de code Panda[8]. La première de ces mises à jour a été publiée en . Le but des mises à jour Panda était de réduire le positionnement des sites Web qui fournissaient une expérience utilisateur médiocre. Pour identifier ces sites, un algorithme d'apprentissage automatique développé par l'informaticien Navneet Panda était utilisé, d'où le nom de code des mises à jour[9]. L'algorithme avait été développé par des techniques d'intelligence artificielle à partir d'évaluations faites par des humains sur l'expérience utilisateur d'un grand nombre de sites.
En , une mise à jour basée sur la mise en page des sites a été publiée[10]. Cette mise à jour visait a réduire le positionnement des pages qui affichaient peu d'information sur la partie de la page visible sans utilisation de la barre de défilement[11].
Penguin vise aussi à améliorer l'expérience utilisateur, mais en mettant plutôt l'accent sur la réduction du positionnement des sites utilisant le référencement abusif. Les mises à jour Panda ne se préoccupaient pas des référencements abusifs. Google cherche donc à empêcher les webmasters de faire du Black hat pour offrir aux internautes des contenus de qualité.
Formulaires de rétroaction
Deux jours après l'introduction de la mise à jour, Google a publié un formulaire de rétroaction destiné à deux catégories d'utilisateur :
- ceux qui veulent signaler un site qui pratique le référencement abusif (spamdexing) et qui est encore bien positionné malgré l'introduction de la mise à jour ;
- ceux qui pensent que leur site est mal positionné injustement par l'algorithme.
Google avait aussi précédemment publié un formulaire de réexamen dans les Google Webmaster Tools pour les 700,000 sites qui avaient reçu un message électronique indiquant que ces sites présentaient des liens suspects.
Évolution de Google Penguin
Une première mise à jour de cet algorithme a eu lieu . Cette mise à jour, selon Matt Cutts, devait toucher moins d'un dixième d'un pour cent des recherches en langue anglaise.
Google Penguin 2.0 a été déployé le [12]. Il s'agit du quatrième lancement du filtre. La mise à jour impacterait 2,3 % des résultats de recherche anglophones. Cette version intègre désormais l'algorithme Penguin aux mises à jour quotidiennes de Google.
Google Penguin 2.1 a été déployé le . Cette version de Penguin apparaît comme la suite de la version précédente et semble être mineure. D'après Matt Cutts, elle n'impacterait qu'environ 1% de l'ensemble des résultats de recherche.
Google Penguin 3.0 a été déployé le . L'objectif de cette version est d'améliorer encore la détection d'abus de liens et notamment la détection de réseaux de sites développés uniquement dans le but de créer des liens artificiels. Cette mise à jour a été déployée sur une longue période puisque Google a indiqué au début du mois de que les mouvements remarqués par les webmasters étaient dus à la mise à jour Google Penguin 3.0 lancée six semaines plus tôt.
Source
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Google Penguin » (voir la liste des auteurs).
Références
- The Penguin Update: Google's Webspam Algorithm Gets Official Name
- Another step to reward high-quality sites - Inside Search
- Webmaster Guidelines - Webmaster Tools Help
- Keyword stuffing - Webmaster Tools Help
- Cloaking, sneaky Javascript redirects, and doorway pages - Webmaster Tools Help
- Link schemes - Webmaster Tools Help
- Duplicate content - Webmaster Tools Help
- Infographic: The Google Panda Update, One Year Later
- http://alumni.cs.ucsb.edu/~panda/published_papers/acmmm_06.pdf
- Official Google Webmaster Central Blog: Page layout algorithm improvement
- Browser Size - Google Labs
- (en) « Penguin 2.0 rolled out today », sur Matt Cutts: Gadgets, Google, and SEO, (consulté le ).
Voir aussi
Liens externes
- (en) « As Google Tweaks Searches, Some Get Lost in the Web » dans le Wall Street Journal
- (vi) seotrends
- (vi) ngoisaogiadinh
- (vi) thientumedia
- (vi) thientu
- Portail de Google
- Portail d’Internet
- Portail de la sécurité informatique