[étude] Les 100 meilleures pages en SEO ?

Lionel Miraton,
2 votes, average: 4,50 out of 52 votes, average: 4,50 out of 52 votes, average: 4,50 out of 52 votes, average: 4,50 out of 52 votes, average: 4,50 out of 5
Loading...

Lors d’une rencontre SEO récente, nous discutions avec des référenceurs sur le nombre de mots-clés différents sur lesquels une même page pouvait se positionner. Les expériences alors partagées faisaient état de pages qui parvenaient à se positionner sur quelques centaines de mots-clés.

Pour les INSIGHT, Yooda relève les positions sur Google.fr pour près de 22 millions de mots-clés. Cela nous permet, sur demande, de faire des analyses statistiques sur les résultats de Google. Pour apporter une réponse à cette question, nous avons donc analysé les 220 millions de résultats naturels pour identifier les pages qui se positionnent sur le plus de mots-clés.

Nous vous livrons ici le classement des 100 pages qui obtiennent le plus positions sur Google.fr, avec pour chacune le nombre de mots-clés positionnés.

TOP100 des meilleures pages SEO sur Google

Une structuration du contenu insuffisante ?

On peut faire plusieurs observations sur les types de pages présentes dans ce classement.

Tout d’abord, vous remarquerez dans les pages classées, 80% sont des pages d’accueil. On peut imputer cela à leur popularité supérieure… mais pas seulement.
Ensuite, vous aurez noté la forte sur-représention des sites de jeu (14% des  résultats), des Webmails et FAI (14% des résultats) et des sites pornographiques (15% des résultats). Là encore, on pourra trouver une explication dans la structure des contenus.

En fait, si l’on regarde d’un peu plus près les pages de ce classement, on observe deux configurations récurrentes.

Les contenus protégés

Les sites de webmail, les sites de banques, les annuaires, voire certains sites de voyages proposent la majorité de leurs contenus derrière un formulaire de recherche ou un formulaire de connexion. Cela implique que la majeure partie des contenus ne sont pas directement accessibles à l’internaute. Alors que de son coté, Google lui a les moyens de qualifier ces contenus, par le remplissage des formulaires ou les backlinks.

Dès lors, on observe souvent que l’essentiel des positionnements vont être obtenus via la page d’accueil. Ce cas est fréquent dans notre classement.

Les contenus tournants (User Generated Content)

Autres cas récurrent dans le classement, les sites proposant des flux de contenus. Les nouveaux contenus viennent remplacer ou ensevelir les contenus plus anciens. On peut ranger dans cette catégorie les sites d’annonces (emploi, auto, petites-annonces), les portails de vidéo pornographiques, les sites de jeux et paris (avec des résultats rafraîchis chaque jour).

Là encore, c’est une page (généralement la page d’accueil) qui va concentrer les faveurs de Google.

Un signal d’alarme SEO !

Même si cela paraît un bon résultat, une telle concentration du SEO sur une seule page est un signal d’alarme. Cela implique en effet que seul le périmètre sémantique de cette page « travaille ».

Dans la plupart des cas, c’est le symptôme d’un contenu insuffisamment structuré et catégorisé. Google peine à identifier une structure dans le contenu. Les pages internes lui apparaissent comme peu différenciées et de peu d’intérêt.

Des solutions existent. Elles sont différentes selon le type de site web. Une analyse SEO de la concurrence, ou des sites similaires, est sur ce point toujours instructive.

 

2 votes, average: 4,50 out of 52 votes, average: 4,50 out of 52 votes, average: 4,50 out of 52 votes, average: 4,50 out of 52 votes, average: 4,50 out of 5
Loading...
11 Commentaires
fred

Je suis mitigé par une partie des conclusions.
L’omniprésence de certains sites reflète plus le comportement des internautes qu’un réel indice de qualité SEO. Le succès des sites pornos dans ce classement provient de la forte proportion des requêtes dans ce domaine dans ton pool de mots-clé. Un peu comme si on comparait le 20h de TF1 à Médiapart, et qu’on en conclurait que TF1 est de bien meilleure qualité journalistique car avec une plus forte demande.
De même, la forte domination des pages d’accueil en tant que page de destination doit surtout refléter la présence encore intense des requêtes larges (tu me confirmeras) dans les thématiques concernées … ce qui me fait au contraire penser à un bon travail SEO derrière tout ça.
Enfin chez Yooda, vous avez tout ce qu’il faut pour affiner, j’espère qu’on aura droit à quelques rapport de ce genre (comme celle sur le tourisme au SEO camp « on the beach »)

Lionel Miraton

Bonjour Fred. Intéressant ton commentaire.
L’échantillon de mots-clés est de 22 millions. Autant te dire que les derniers millions sont des mots-clés qui ne font qu’une dizaine de recherches par mois.
Je ne pense pas que l’on puisse parler de sur-représentation d’un thème en particulier ou de sur-représentation des requêtes larges dans l’échantillon.
Je n’ai pas cherché à faire du cas par cas. Je suis certain que ces chiffres recouvrent des réalités différentes.

Mais il m’a semblé que l’on pouvait dégager des configurations récurrentes. La 1ère page du classement concentre des positions sur +7000 mots-clés différents… sur les +12K sur lesquels est positionné le site. C’est à la fois une grosse performance… et un point d’interrogation.

fred

Merci pour ces réponses. Pas mal de questionnement en tout cas. Il y a de quoi fouiller pour exploiter tout ça, une petite mine d’or qui doit intéresser pas mal de spécialistes, et pas que dans le SEO!
Parmi les quelques pistes (modestement) pour filtrer un peu plus :opérer une pondération sur les requêtes (par exemple pour les même requêtes écrites avec différentes orthographes, avec ou sans « stopwords », le nombre de mots). Enfin, les idées vont sans doute fuser dans la communauté 🙂

dédé

merci pour la liste, il y a quelques sites de pr0n que je connaissait pas ^^

512banque

La vraie question, et de là découlent toutes les conclusions, c’est celle du choix du corpus des 22M mots-clés.

Lionel Miraton

Ce sont les 22 millions de mots-clés les plus recherchés par les internautes français (sélectionnés sur une base de 56 millions de mots-clés évalués).

Kekoblo

Les 22 millions de mots-clés que vous indiquez incluent-ils les stopwords et autres ancres anonymes (cliquez ici, prenom, voir, lien, etc…) ?

Lionel Miraton

Ce sont les 22 millions d’expressions clés qui sont recherchées par les internautes français. Donc oui, une partie de ces expressions incluent des mots de liaison, des pluriels, etc…
La base est celle des Webtools, vous pouvez avoir un aperçu ici.

centre-d-appel

Les résultats sont parlants et en effet il y a de quoi réfléchir sur l’importance qu’est accordée à la page d’accueil au détriment des autres pages du site qui du coup proposent des contenus ou des catégories non structurés…

pascal

YP n’a pas besoin de mots clés pour être en pole position. C’est la thématique qui attire tout simplement. pour les 22 M de mots clés, est ce vraiement utile d’avoir un affinage si fin ?

Lionel Miraton

Certes… Mais l’étude porte sur la visibilité SEO, donc ça passe par l’analyse des positions sur les mots-clés recherchés. Pour les 22 millions (qui sont devenus 24M entre temps), ils garantissent une représentativité maximale.
Ce sont ceux utilisés pour analyser le SEO des sites web dans Webtools.