Testez si votre site risque une pénalité

Le ChelouRank était notre poisson d’avril 2014

Nous espérons qu’il vous aura donné le sourire quelques minutes.

Pour ceux qui se seraient laissés prendre, sachez que l’on prends cela comme un compliment à notre crédibilité. Nos équipes travaillent tous les jours à vous offrir toujours plus de données, avec une valeur croissante.

Merci également à tous ceux qui ont joué le jeu sur les réseaux sociaux.

Si vous souhaitez disposer un jour de vrais outils d’évaluation du spam, participez à l’étude des frères Peyronnet.

En développant des outils comme les Webtools, nous emmagasinons de plus en plus de data SEO. Ils vous servent directement dans les Webtools, mais ils nous permettent également de mener quelques études.

Big data SEO

Au cours des derniers mois, nous avons analysé l’évolution de près de 500 millions de positions en 1ère page de Google. La tentation était forte de tenter de corréler ces évolutions au positionnement. Mais l’algorithme de classement de Google est très complexe. Dans un premier temps, nous avons préféré nous concentrer sur la détection du spam.
En analysant les sites qui perdaient brutalement des positions, principalement à l’occasion des update Panda et Pinguin, nous avons pu dégager quelques pistes.
Pour cela, nous avons dû mobiliser toutes les informations dont nous disposions au sujet des sites web : positions, liens, et une étude des 100 TOP pages de ces sites.

Pré-détection du spam

A partir de ces informations, nous avons combiné plusieurs approches classiques permettant de détecter le spam :
ChelouRank
Tout d’abord, une approche du type TrustRank, mais inversé. Une sorte de spamrank en quelques sortes. On part d’une liste de sites spammy (les seeds), et on distribue une probabilité de spam à travers les liens (voir les travaux de R. Baeza-Yates et C. Castillo).

Toujours sur les liens, nous avons cette fois utilisé quelques algorithmes permettant de détecter les shémas (link wheel, liens réciproques, réseaux).

Ensuite, un algorithme permettant de mesurer la distillation thématique (topic distillation voir les travaux de K. Bharat and M. R. Henzinger).

Enfin, une analyse du degré d’optimisation des 100 Top pages des sites, comparée aux pages de la même thématique du jeu de donnée.

Votre site est-il spammy ? Faites le test !

Le croisement de ces différentes approches a permis de dépasser la performance habituelle de ces algo… et surtout, de vous proposer un outil gratuit.

Cet outil vous permet de déterminer si votre site web risque d’être étiqueté comme « potentiellement spammeux » aux yeux des moteurs de recherche.

Testez gratuitement

Note : L’outil est encore en béta. N’hésitez pas à nous signaler tout problème
Note 2 : On a gardé le nom du projet R&D pour l’outil… il est fun en fait.