nov 05

Tout référenceur se doit de posséder une panoplie d’outils SEO (*) lui permettant d’auditer rapidement et efficacement le référencement d’un site internet. Le premier outil SEO, c’est certainement de disposer d’une check-list simple mais complète donnant un premier aperçu de l’état du référencement d’un site web.



 

Je vous livre ici une check-liste “standard” mais détaillée pour un pre-audit référencement. A chacun d’y ajouter sa touche personnelle. Si vous débutez en référencement je vous renvoie vers mon premier article sur ce blog : Reussir son referencement en 10 points.
A noter qu’il s’agit ici d’un premier audit technique de site internet de petite ou de taille moyenne, analysant essentiellement les facteurs bloquants. L’étude des mots clés stratégiques et du public visé, de l’écriture des pages web et de la sémantique, de l’exploitation de la longue traîne, du profil et maillage de liens externes ou internes avec leurs ancres, du positionnement et de la concurrence, font l’objet d’audits approfondis et complémentaires. Ces audits, souvent qualifiés d’audit marketing, stratégique, netlinking, sémantique ou encore éditorial, sont bien évidemment clés pour un audit référencement complet.

Mais dans un premier temps, avant de s’embarquer dans ces études plus poussées, il convient de passer en revue le site et d’identifier tout facteur pouvant nuire au bon référencement et positionnement du dit site.

Checklist audit technique :

 

1/ Premières impressions en tant qu’utilisateur

  • Navigation intuitive
  • Découverte rapide de l’info recherchée
  • Facilité d’action e.g. remplir un formulaire ou commander un article

2/ Accessibilité pour les utilisateurs et les robots

  • Naviguer sur le site en interdisant le JavaScript, les cookies, la mise en page css
  • Dégradation JS / Ajax
  • Vérifier le fichier robots.txt (erreurs ou interdictions d’urls importantes)
  • Tests et erreurs exploration en tant que robot (réponse serveur http, urls non trouvés, liens morts, accès restreint, etc)
  • Parcourir le site sous useragent/IP Google (détection du cloaking)

3/ Etat indexation Google

  • Nombre de pages indexées (requête site:url domaine)
  • Requête sur le nom de domaine
  • Caches de Google pour pages clées (e.g. contenu caché)
  • Présence site links, mini site links, clustering
  • Outils webmasters (identification erreurs, % nbre urls vs. sitemap)
  • Flux (structure, stats)

et pour les courageux voir aussi Yahoo! et Bing

4/ Identité

  • Nom de domaine (ancienneté, expiration, première indexation, whois)
  • Serveur & Hébergement (qualité, fiabilité, IP - dédié vs. mutu discount)

5/ Vérification contenu

  • Suffisamment de contenu textuel
  • Warning si trop grand nombre images, videos, liens
  • Pages d’entrée sans contenu, splash page, etc
  • Balises techniques d’en-tête

6/ Contenu dupliqué

  • Vérification copies extérieures sur internet
  • Vérification url canonique (e.g. www vs. sans www, index répertoires)
  • Vérification domaines et sous-domaines connexes (redirections, pages satellites)
  • Checklist audit referencement offerte gracieusement par le blog referencement Paradi’SEO

7/ Balises Title

  • Unique par page
  • Structure et ordre des mots clés, nom du site ou marque

8/ Balises Meta

  • Meta robots (e.g. si utilisation noindex, nofollow)
  • Description (unique, parlante et longueur optimale pour snippet des SERP *)
  • Présence d’autres metas inutiles (ex keyword avec dizaines de mots clés), voire dangereuses (e.g refresh à 0, revisit after)

9/ URLs

  • Url unique par page
  • Urls propres (e.g.variables sessions), courts et parlant (mots clés à bon escient, et facile à retenir)
  • Attention frames, flash, Ajax
  • htaccess (erreurs url rewriting)

10/ Maillage de liens internes et structure du site

  • Architecture & Navigation (nombre de clics, type de liens -html, JS, Flash, etc, fil d’ariane)
  • Nombre de liens (page accueil et têtes de rubriques)
  • Ancre des liens
  • Utilisation Nofollow (erreurs)
  • Pagination (voir aussi contenu dupliqué)
  • Pages orphelines
  • Plan de site html
  • Sitemap xml
  • Page 404 (existence et structure)

11/ Code & HTML

  • Code propre (sans erreur) et léger, e.g. W3C
  • Temps de chargement des pages importantes
  • Externalisation css, scripts JS, animations flash
  • Contenu alternatif (balises alt renseignées, flash, noscript, adéquation avec contenu visible)
  • Noms des fichiers
  • Utilisation preloads, caches, css et image spriting
  • Présence mots clés sémantique html (premier screening)
  • Check liste audit référencement offerte gracieusement par le blog referencement Paradi’SEO

12/ Redirections

  • Vérification http headers
  • htaccess et url rewriting

13/Géolocalisation

  • IP serveur hébergement
  • Nom de domaine, tld pays (e.g. .fr)
  • Outils pour webmasters
  • Indexation Google local business
  • Le cas échéant détection et gestion des langues additionnelles

14/ Liens externes

première revue à ce stade + identification pbs. potentiels

  • Nombre, qualité (présence liens sites d’autorité pour thématique, ODP)
  • Ancres des liens
  • Profil naturel
  • Liens pages profondes (%)
  • Liens achetés et réseaux de liens
  • Eventuellement PR si mise à jour récente (page accueil et distribution interne, warning si beaucoup de pages grisées)
  • Liens du site audité vers des sites spammy, nombreux liens footer, etc

15/ Outils d’analyse

  • Vérification existence outils d’analyse (e.g.Google Analytics)

seulement identification des anomalies les plus importantes à ce stade e.g. trafic moteur, temps passé, nombre de pages, nouveaux visiteurs anormalement faibles, taux de rebond anormalement élevés
Checklist audit referencement offerte gracieusement par le blog referencement Paradi’SEO
Pour ceux qui doivent auditer plusieurs sites et qui aiment les approches structurées, vous pouvez affecter un facteur d’importance à chaque point, noter le site de 1 à 10 sur ce critère, et ensuite utiliser votre tableur préféré … Bon audit !

* voir lexique sur le référencement


Si vous venez de découvrir ce blog, lire en priorité l’article : Les principes de bases du référencement

 

Paradi-SEO logo

« Cliquer sur ce logo pour s’abonner au flux des nouveaux articles du Blog Paradi’SEO

 

A lire aussi sur le même sujet :

promotion et referencement

Diffuser ce billet :

referencement twitter        referencement facebook       


19 commentaires pour “Audit referencement”

  1. Marie-Hélène a écrit :

    Bonjour,
    Paragraphe 11 “css et image spriting”, que veut dire spriting ?

  2. Kev a écrit :

    bonjour, l’utilisation de “sprites” cad d’une image mosaïque contenant x images, avec découpage css pour ne prendre que la partie de la mosaique correspondant à l’image que l’on veut afficher, permet de télécharger une seule image une seule fois au lieu de douzaines d’images. technique de + en + utilisée ! ++

  3. sejour scolaireurl commentaire a écrit :

    Bonjour, et bien cette une belle check liste ça et elle permet de bien dégrossir le travail à faire par la suite
    par contre je suis plus mitigé sur l intéret du PR (mais c est un autre débat)
    merci beaucoup

  4. Antoninurl commentaire a écrit :

    Bonjour, merci pour cette checklist super bien détaillée, toujours utile d’avoir ce genre de doc pour ne rien oublier ! Concernant la validation W3C c’est vrai que c’est idéal, mais pas certain que ce soit important pour le ref d’après Google

    PS : dommage qu’on ne puisse pas s’abonner au commentaire !

  5. Ya-graphic | Référenceururl commentaire a écrit :

    Très utile dans le référencement. C’est bien d’avoir différents point de vue. Je propose quelques bases du référencement on-page (pour les blogs) : -http://www.ya-graphic.com/2009/11/referencement-on-page-dun-blog-dentreprise-les-bases/

  6. sejour scolaire a écrit :

    @ Antonin, il me semble que des tets ont été fait et que la validation W3C n avait aucun impact

  7. Oscar a écrit :

    C’est en effet ce que dit Mr Google ‘boule à zéro’ :) quant aux tests… protocoles pas toujours évident.
    Voir le début de l’article de Kev, ce qui compte dans cette liste et premier audit c’est de pouvoir identifier les facteurs bloquants. Le validateur W3C peut être utilisé pour par ex. déceler de grosses erreurs de code qui pourraient elles avoir un impact important sur le referencement, on peut aussi utiliser d’autres outils, extensions pour Firefox, etc

  8. Agence Publika Referencementurl commentaire a écrit :

    Merci pour cet article qui résume bien les étapes de l’audit de référencement à réaliser ! :)

  9. Rémy Bigoturl commentaire a écrit :

    Très bonne liste en effet pour en oublier le moins possible.

  10. referencement naturel a écrit :

    Merci pour cette petite liste bien sympa

  11. Meilleur Fournisseur a écrit :

    C’est en effet une des listes francophones les plus exhaustives que j’ai eu l’occasion de trouver sur le net.

  12. agence de communication publicom a écrit :

    Merci pour ce post. A savoir que Google est en train de changer la façon d’indexer les pages…pour un effet plus naturel…

  13. gregurl commentaire a écrit :

    Bon petit article, je vois beaucoup de commentaires indiquant que ceci ou celà n’était pas important dans le référencement et l’indexation de sites dans Google and Co, il faut dans tous les cas garder en tête que plus vous gardez vos métas ou autres clean et bien fait plus vous augmenter vos chances d’avoir de bon résultats.

  14. LaurentBurl commentaire a écrit :

    Je n’ai pas analysé en détail, mais je vois un paramètre vital qui manque. Il s’agit du type de serveur car on approche pas un Apache comme un IIS ou ASP ou autres.
    Cela fait découler d’autres paramètres (ex: htaccess, rewrite).
    Dans mes audits, je divise en paramètres “off page” et “on page”. C’est beaucoup plus lisible lorsqu’il s’agit d’attaquer les modifs.

  15. sejour scolaire a écrit :

    @ oscar je suis d accord avec toi, ce que je voulais dire c’est que d’être valide W3C n’est pas une obligation pour un bon référencement, il suffit de faire des tests sur des sites bien classés pour s en rendre compte.
    Par contre effectivement le test pour mettre en valeur une grosse boulette dans le code

  16. Oscar a écrit :

    @Laurent: je réponds à la place de Kev encore aux US. Dans sa liste le serveur est mentionné en 4. Dans ce pre-audit où l’on s’attache à identifier tous les points négatifs et donc le potentiel d’améliorations, les performances du serveur sont amha + critiques que le language utilisé. Mais c’est vrai qu’il n’y pas qu’Apache sur le web !
    @sejour: Kev semble OK :) (voir point 10 de http://blog.paradiseo.fr/reussir-son-referencement-en-10-points,92.html, perso j’aime bien les sitemaps html et xml surtout sur les gros sites, car une arborescence n’est jamais parfaite car souvent le résultat de compromis et évolutions dans le temps)

  17. LaurentB a écrit :

    J’ai bien vu le point 4, mais pas de mention du type de serveur. Ce qui n’a rien à voir avec la qualité et fiabilité comme mentionné.
    Ce n’est pas pour pinailler, mais le type de serveur est la 2ème ligne de mes audits, juste après le type MIME qui ne figure pas non plus dans cette liste.
    Encore une fois, tout le reste découle de ces paramètres.
    Je ne vois pas trop ce que vous voulez dire par pré-audit. Cette liste est un audit technique à part entière.

    Je plussoie séjour scolaire à propos de la valid W3C. Absolument aucun impératif d’être valide pour être bien référencé. Cela peut même être une sacrée perte de temps pour pas grande chose de courir après la validation.

    D’ailleurs, un autre truc à bien garder à l’esprit concerne la différence entre les facteurs bloquants et ralentissant. J’établis une hiérarchie “feu vert”, “feu orange”, “feu rouge” afin de faciliter la compréhension pour le client.

  18. Oscar a écrit :

    @LaurentB
    Validation W3c n’est de fait pas à notre connaissance un critère de positionnement (voir commentaires et liens ci-dessus). Ceci étant dit pour des développeurs utilisant les bonnes pratiques et respectant les standards, ce n’est pas une perte de temps, car avantages en dehors du référencement (cross browsers, perception clients, etc)

    Serveur: notre point de vue (du moins le mien :) ) ici, c’est que quelque soit le langage utilisé ce qui compte c’est la performance. i.e. pourquoi optimiser son code et le temps de chargement de ses pages (e.g. css sprites) si le serveur rame !? Visiblement un point sensible pour Google d’après les dires récents de Matt Cutts (même sans être un critère de positionnement, c’en est déjà un pour l’indexation du max. de pages). Re mime voir entêtes/headers.

    Pre-audit parce que vont suivre audits approfondis : marketing, stratégique (public visé, mots clés, concurrence), etc, cf. début article. Ta symbolique des feux tricolores me semble très bien, notamment pour présentation de l’audit. Re. outil Kev fait allusion à la fin de son post à une approche structurée i.e. développement d’un outil qui donne le statut et le potentiel d’amélioration (ce serait par ex. 100 % pour un robots.txt avec un User-Agent: * Disallow: / :) ) … mais bon ça on ne va peut-être pas le publier librement, ce n’est pas encore Noël !

    Le but de cet article est éducatif i.e. une liste de points à vérifier et à ne pas oublier, et à chacun ensuite de développer sa méthode et ses outils persos.

  19. Surmezururl commentaire a écrit :

    J’ai trouvé cet article très instructif! la liste est très complète. Il est vrai que dans le domaine de référencement, il ne faut rien négligé même les petits détails pour ne pas être pénalisé, d’autant plus que les critères de pertinence de Google devient de plus en plus précis.