Business

Supprimez vos erreurs 404 dans Search Console ! Méthode détaillée

Article mis à jour le 12 mai 2023, publié initialement en mars 2016

Le scénario est le suivant : malgré vos efforts, Google liste des erreurs 404 (ou autres types d’erreur) dans le rapport “Pages > non indexées” de la Search Console. Est-ce grave ? Comment les corriger et les faire disparaître de GSC ?

Les erreurs 404 pénalisent-elles le référencement ?

Ce que dit Google

Voici les explications fournies par Google :

En général, les erreurs 404 n’ont aucune incidence négative sur les performances de votre site dans les résultats de recherche, mais elles peuvent vous aider à en améliorer l’expérience utilisateur.

Source : centre d’aide Google

Dans l’aide, on trouve des conseils supplémentaires :

Elles se produisent souvent à la suite de fautes de frappe ou d’erreurs de configuration, par exemple dans le cas de liens générés automatiquement par un système de gestion de contenu. Elles peuvent aussi être le résultat du développement croissant mené par nos services pour détecter et explorer les liens présents dans des contenus intégrés tels que JavaScript.

Cette dernière phrase n’est pas très claire, mais en gros on peut comprendre que Google cherche parfois à accéder à des URL qui n’existent tout simplement pas, mais son interprétation des codes Javascript fait que Google estime que ces URL peuvent exister…

Je termine par les derniers conseils de Google sur les 404 :

Il est tout à fait normal, voire souhaitable dans certains cas, de rencontrer des codes d’erreur 404 sur le Web. Vous ne pourrez probablement jamais contrôler tous les liens qui redirigent vers votre site ni résoudre toutes les erreurs 404 qui s’affichent dans la Search  Console. Concentrez-vous plutôt sur les problèmes les plus importants, résolvez ceux que vous pouvez, puis passez à une autre étape.

Alors ? L’objectif de mon article est justement de vous aider à comprendre quelles sont les erreurs les plus importantes, qu’il faudrait corriger.

Mon avis sur l’impact SEO des erreurs 404

Mon point de vue :

  • si une page générait du trafic (SEO) et se retrouve en erreur (404 ou autre), c’est un réel problème de référencement, qu’il faut absolument corriger.
  • si une page est en erreur 404 à cause d’un lien venant de l’extérieur, vous n’y pouvez rien et cela ne dégrade pas vos performances SEO. Mais si ce lien est de qualité, tant qu’il génère une erreur 404 vous n’en profitez pas, donc vous devriez corriger le problème.
  • si vous avez trop d’erreurs 404 dans vos liens internes, cela dégrade l’expérience utilisateur si bien que vous devriez les corriger

Comment corriger les erreurs 404 ?

A votre place, je suivrais les étapes suivantes…

Etape 1 Corriger les erreurs 404 générées par les liens internes

Si jamais des erreurs 404 sont causées par des liens internes, il faut absolument les corriger car :

  • ces erreurs dégradent l’expérience utilisateur
  • ces erreurs nuisent à votre référencement puisqu’une page ne reçoit pas le lien que vous aviez prévu de lui faire
  • c’est facile à détecter et à corriger 🙂
  • ça fera un premier nettoyage de la liste des erreurs 404 indiquées dans Search Console

C’est un excellent cas de figure où mon outil RM Tech va énormément vous aider et vous faire gagner du temps. Il s’agit d’un outil d’audit SEO en ligne : vous indiquez l’URL du site à étudier et vous n’avez rien d’autre à faire qu’attendre qu’il ait fini. Dès que votre rapport d’audit est prêt, regardez dans la rubrique “Analyse du crawl et de l’indexabilité” le rapport “État des URL crawlées” qui dresse le bilan des codes HTTP rencontrés sur votre site, uniquement en suivant vos liens internes.

Voici un exemple avec un site qui avait besoin d’un gros nettoyage (plein d’erreurs dans les liens internes) :

RM Tech tableau codes HTTP
RM Tech dresse dans un tableau le bilan des codes HTTP rencontrés

Sous forme graphique, on se rend compte de la gravité des problèmes :

RM Tech graphique codes HTTP
La même info sous forme graphique

Pourquoi utiliser RM Tech et pas simplement Search Console ? Je détaille ci-dessous comment utiliser les rapports de la Search Console, mais vous verrez que cela ne suffit pas d’avoir la liste des URL en erreur : il vous faut aussi la liste des URL qui font ce lien erroné. Search Console en donne une partie (pas tout) mais c’est manuel, URL par URL, ce qui en pratique se révèle très peu efficace.

Avec RM Tech, non seulement vous avez la liste des pages en erreur, mais pour chacune des erreurs vous avez la liste des pages de votre site qui font un lien vers cette page en erreur. Un lien qu’il faudra bien entendu modifier ou supprimer (selon les cas).

RM Tech liens vers erreurs de crawl
Une annexe très précieuse liste TOUTES les pages faisant un lien interne cassé

Etape 2 Corriger les erreurs 404 générées par les sitemaps

Utilisez un outil d’analyse de l’entête HTTP pour vérifier que chaque URL indiquée dans votre sitemap renvoie bien un code 200 (ce qui signifie que tout est OK). Il ne doit pas y avoir de redirection et encore moins d’erreur 404 (ou 403, 410, 500, etc.).

Si vous êtes perdu dans tous ces codes : consultez la liste des codes HTTP.

Si ça fait trop d’URL à tester (c’est probable), utilisez mon outil d’audit de sitemap XML.

Etape 3 Corriger les erreurs 404 générées par les backlinks

Il est possible que certaines erreurs 404 soient liées à des backlinks, c’est-à-dire des liens issus d’autres sites, pointant vers une mauvaise URL de votre site. Pour les identifier, utilisez votre outil préféré d’analyse de backlinks (Majestic, Ahrefs ou Moz) et récupérez la liste des backlinks pointant vers une erreur 404. Majestic a publié un article sur ce sujet, à vous de l’exploiter pour votre propre site au lieu de celui d’un concurrent.

Si celui qui a fait le lien s’est trompé légèrement dans l’URL, c’est dommage et il faut le corriger :

  • contactez le webmaster du site qui vous fait le lien en erreur pour lui demander de le corriger. Présentez-lui ça de façon positive en lui expliquant qu’il a un lien cassé sur son site…
  • s’il ne répond pas, mettez en place une redirection 301 de la mauvaise URL vers la bonne

Pour les détails, lisez mon dossier “Comment transformer des erreurs 404 en backlinks” (OK, ce titre est un peu exagéré…).

Evidemment, si le lien est de mauvaise qualité en raison du site émetteur, mieux vaut ne pas le corriger, car c’est ce qu’on appelle un lien nocif pour le SEO

Etape 4 Corriger les autres erreurs 404

Une fois que vous aurez validé les étapes précédentes, attendez 1 ou 2 semaines que Google mette à jour votre compte Search Console. Voilà où il faut aller…

  1. Dans la section “Indexation”, cliquez sur “Pages”
Rapport sur les pages dans l'indexation search console
Rapport Search Console sur l’indexation des pages
  1. Vérifiez que la case “Non indexées” est cochée (fond gris, pas blanc) et repérez “Introuvable (404)” dans le tableau, si vous avez cette ligne…
accès aux pages 404 dans Search Console
pour accéder à la liste des erreurs 404 dans Search Console
  1. Cliquez sur la ligne pour consulter les exemples fournis (1000 maximum). Cliquez en haut à droite sur “Exporter”
erreurs 404 listées dans GSC
Google liste les erreurs 404 rencontrées (1000 exemples au maximum)

Astuce : si vous avez déclaré votre sitemap (ce que je recommande), choisissez “Toutes les pages envoyées” à la place de “Toutes les pages connues”. Ainsi, vous saurez si Google a identifié des pages 404 dans votre sitemap.

filtre toutes les pages envoyées
filtre toutes les pages envoyées dans Search Console

Si c’est plus simple pour vous de gérer la liste dans Excel, il vous suffit de télécharger le tableau. Pour chaque URL, vous aurez la date de dernière exploration (crawl).

Astuce : si vous avez beaucoup d’erreurs, vous arriverez peut-être à la limite fixée par Google, à savoir 1000 URL. Pour la contourner, il suffit de déclarer une sous-partie de votre site en tant que nouvelle propriété dans Search Console. Cette technique ne marche que si vous avez des répertoires à la racine, par exemple /blog/. Dans ce cas, vous pouvez déclarer https://www.example.com/blog/ comme nouvelle propriété ; elle sera validée immédiatement et vous pourrez consulter la liste des erreurs 404 concernant uniquement ce répertoire. Pratique !

Faut-il rediriger vers la page d’accueil les erreurs 404 ?

Je rencontre encore régulièrement des sites mal configurés, sur lesquels en cas de page introuvable on est redirigé vers la page d’accueil. Ne faites surtout pas ça !

  • vous pourrez beaucoup plus difficilement vous rendre compte des pages introuvables (elles seront absentes des rapports Search Console par exemple)
  • je déconseille de rediriger plein de pages différentes vers la page d’accueil

D’ailleurs l’aide en ligne de Google confirme qu’il faut qu’un serveur web renvoie un code 404 quand une ressource est introuvable :

Il est tout à fait normal, voire souhaitable dans certains cas, de rencontrer des codes d’erreur 404 sur le Web.

Vous avez peut-être configuré une page d’erreur 404 personnalisée (c’est très bien). Vérifiez malgré tout que le code HTTP renvoyé est bien un code 404, et pas 302 (redirection temporaire). Utilisez un outil de test de code HTTP sur une URL inexistante de votre site. Si vous avez une redirection 302, c’est sans doute que vous avez indiqué une URL entière dans votre fichier .htaccess pour la page d’erreur personnalisée.

La mauvaise façon de la définir :

ErrorDocument  404  http://www.example.com/page-introuvable.php

Voici la bonne façon (notez que l’adresse de la page personnalisée commence par / et non pas par http) :

ErrorDocument  404  /page-introuvable.php

Si besoin, lisez comment avoir une page d’erreur 404 personnalisée au design du site.

Besoin d’aide ?

Si vous n’y arrivez pas ou que quelque chose n’est pas assez clair pour vous, n’hésitez pas à poser la question dans les commentaires ou dans le forum WebRankInfo.

Vous pouvez aussi me contacter pour du consulting.

Cet article vous a-t-il plu ?

Source link