Dans une vidéo récente (14 Février 2014), John Mueller évoque le fait que Googlebot ne pourrait suivre que 5 redirections … La vidéo en question (le sujet qui nous intéresse est à 46 minutes) : [tboot_column_wrap] [tboot_column size= »6″]

[/tboot_column] [tboot_column size= »6″] [/tboot_column] [/tboot_column_wrap]

On retrouve entre autre, l’information chez arobasenet, sur SEROUNDTABLE et bien d’autres encore.

Google: GoogleBot ne suivrait que 5 redirections à chaque visite

Noel Nguessan – arobasenet

De toute évidence, John fait référence à une « chaîne » de redirections (ce qui n’est pas toujours évident lorsqu’on lit certains articles sur le sujet). Par exemple, la page A1 n’est plus la bonne. Une redirection est mise en place vers A2, qui à terme n’est plus la bonne page non plus, une redirection est donc mise en place vers A3 … et ainsi de suite jusque à A6.

redirection-en-chaine

chaîne de redirection

Ce qui nous fait 5 redirections en chaîne, Googlebot s’arrêtera à priori en A6 (à mon avis, il y a même des chances qu’il s’arrête avant). [tboot_well width= »100% »]Donc, cette news n’en est pas vraiment une, puisque si vous faites des chaînes de plus de 5 redirections vous avez un souci et il y a des chances que cela n’impacte pas que le SEO.[/tboot_well] La bonne pratique, serait ici de faire évoluer les redirections ainsi :

bonne-pratique

bonne pratique

Les différentes pages redirigent vers la même page cible. On obtient ainsi une « chaîne » d’une seule redirection qui permet d’atteindre rapidement la page cible. Facile à dire (écrire) mais pas toujours évident à mettre en place si on travaille sur un grand nombre d’URLs. Cela sous entend de garder un historique et une « table de correspondance », sinon on arrive vite à quelque chose d’ingérable.

Dans quels cas peut-on avoir 5 redirections ?

Quels sont les cas de figure qui peuvent engendrer une telle « chaîne de redirections » ? Se retrouver avec de telles redirections relève d’un dysfonctionnement, essayons de comprendre d’ou celui-ci peut provenir. On notera encore une fois que ce chiffre de 5 redirections en chaîne est un maximum.

Problèmes de process interne

Le souci peut provenir des process internes de la structure en charge du site web. Par exemple, les changements dans l’écriture des URLs sont fréquents et engendrent un grand nombre de redirections qui sont « chaînées » au lieu d’être concentrées vers l’URL cible finale. Mais pour que tout ceci arrive il faut plusieurs facteurs, que les URLs changent souvent et qu’aucune vérification n’ait lieu. Dans ce cas de figure, il est probable que seules quelques URLs soient concernées. C’est indéniablement un avantage, puisque seuls quelques uns de nos contenus seront pénalisés. L’inconvénient ici est que cela devient difficile à détecter. Des outils de crawl simples comme xenu ou wget doivent permettre de détecter ces problèmes.

Problèmes applicatifs

Une autre source de dysfonctionnement peut être le site web en lui même. Le code (php/java/…) génère des redirections qui sont mal maîtrisées.

probleme-applicatif
Problèmes applicatifs

 Dans l’image ci-contre, un CMS bien connu tente de gérer la redirection d’une URL non ré-écrite vers une URL user-friendly. On ajoute à cela une gestion hasardeuse des langues (redirection suivant l’entête « Accept-Language ») et on obtient déjà 3 redirections sans que jamais le contenu n’ait changé d’URL. Le problème avec les aspects applicatifs, c’est que cela peut concerner facilement un pourcentage non négligeable des contenus. Cela se transforme en avantage dans la mesure où il est difficile de passer à coté puisque aucun produit n’est référencé …

Le fond du problème

Que l’on ait 3/4 ou 5 redirections en chaîne ne change pas grand chose au principe. Chaque redirection demande du travail supplémentaire à Googlebot qui doit aller chercher un contenu qui n’en est pas un. Or, demander du travail inutile à Google, c’est prendre le risque qu’il n’ait plus le temps d’effectuer ce qui est utile. Donc, prendre le risque d’être mal référencé. De plus chaque redirection fait perdre de la popularité à la page cible finale, popularité si difficile à gagner depuis les récentes mises à jour. Donc, évitons de maltraiter les liens si chèrement gagnés et évitons les redirections inutiles.

Prévenir – quelles actions mettre en place

Afin d’éviter de tomber sous le coup des 5 redirections maximales, il convient de mettre en place certaines procédures. Dans le cas qui nous intéresse, détecter le problème est déjà quasiment le résoudre, la solution pour le résorber dépendant grandement de son origine et de son ampleur.

Surveiller les indicateurs de Google Webmaster Tools

URLs non suivies dans Google Webmaster Tools

URLs non suivies dans Google Webmaster Tools

Même si l’outils n’est pas parfait pour cette tâche, c’est le canal mis en place par Google pour communiquer avec les Webmasters. La rubrique « Erreurs d’exploration » comporte une section consacrée aux URLs non suivies qui peut nous renseigner sur les redirections posant problème.

URLs non suivies - liste des URLs et de leur code réponse

URLs non suivies – liste des URLs et de leur code réponse

Une fois l’onglet sélectionné, la liste des URLs et des codes réponses permet d’y voir plus clair.

Vérifier les logs

En monitorant le passage de Googlebot sur un site, on peut suivre l’évolution des codes réponses et de leur proportion. Une augmentation soudaine des codes reponses 30X devra vous mettre en alerte.

Crawl du site

Faire un crawl régulier du site ainsi qu’après chaque mise à jour « importante » est une bonne habitude qui vous permettra de déceler un volume de redirections anormale.

Suivant la taille du site on utilisera un crawler adapté et éventuellement des KPI différents.

 

Google Chrome - Console Réseau

Google Chrome – Console Réseau

Sur un petit site, ou pour vérifier quelques URLs,  l’utilisation de votre navigateur favoris en désactivant les cookies et le javascript permet de simuler Googlebot (modulo le referer). L’option « console – Network » de Google Chrome (ou de firefox) permet alors de suivre les échanges client / serveur et les codes réponses associés.

A propos de l'auteur :

Consultant SEO avec plus de 10 ans d’expérience. J'ai travaillé pour différentes agences parisiennes de SEO. Depuis 2012 je suis à mon compte et j'optimise le référencement naturel de mes clients.


2 Comments » for Googlebot et les redirections
  1. ref@graphemeride.com' Graphemeride dit :

    Ah, quand j’avais vu passer l’information, je pensais au crawl de googlebot à chaque passage sur le site (genre, je viens et je ne visite que 5 pages à la fois). Je n’avais pas saisi le coup de la redirection au début !

  2. paul dit :

    @Graphemeride c’est un peu ce qui ressortait des transcriptions du hangout que j’avais lu, c’est pour cette raison que j’ai fait l’article.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*