Article mis à jour le 28/06/2022 (conseil de John Mueller sur les URL), publié initialement le 12/09/2009
Qu’est-ce qu’une URL ?
Définition
L’URL d’un contenu est son adresse, qui commence par http://
ou https://
à laquelle on accède généralement par un navigateur. En anglais, URL signifie Uniform Resource Locator, ce qu’on peut traduire par localisateur uniforme de ressource.
Exemple d’URL
Voici par exemple l’URL de l’article que vous êtes en train de lire :
https://www.webrankinfo.com/dossiers/techniques/url-et-referencement
Et voici l’URL de la page d’accueil du site WebRankInfo :
https://www.webrankinfo.com/
Le format des URL (composition)
Avant tout chose, assurez-vous d’avoir lu le guide complet de la syntaxe des URL (sous-domaine, nom de domaine, extension, répertoires, etc.).
Comment optimiser les URL en SEO ?
La stabilité des URL, critère le plus important
N’allez pas modifier l’URL de vos pages uniquement pour y rajouter des mots-clés surtout si votre référencement fonctionne déjà bien comme ça. Pour des nouvelles rubriques de votre site ou pour un nouveau site, intégrez des mots-clés dès le début. Pour un site ancien, attendez le jour où vous aurez besoin de faire une refonte importante pour intégrer ce genre d’optimisation.
Partagez l’info à vos abonnés Twitter :
SEO : le + important pour une URL, c’est sa stabilité, + que la présence de mots-clésClick to Tweet
D’ailleurs John Mueller (Search Advocate chez Google) l’a confirmé :
L’impact SEO des mots-clés dans l’URL est minime une fois que le contenu est indexé. Créez des URL qui fonctionnent pour vos utilisateurs, pas pour le référencement. De plus, changer d’URL sur un site existant est une migration de site et cela prendra du temps/des fluctuations pour être traité, donc j’éviterais cela sauf si c’est critique.
John Mueller, 19/08/2020 sur Twitter
Je vous recommande le livre Techniques de référencement web rédigé par Alexandra Martin et Mathieu Chartier. Connaissant les 2 auteurs et ayant lu ce livre (3ème édition), je sais qu’il vous sera d’une grande aide. Il rentre dans les détails (+ de 500 pages) et fournit de nombreux exemples de code, d’API ou d’outils à utiliser pour optimiser votre référencement.
Faut-il des mots-clés dans l’URL ?
D’abord, je préfère être clair : l’URL est loin d’être le principal élément permettant d’optimiser le référencement d’une page. Avant de vous demander s’il faut mettre des mot-clés dans les URL, intégrez-les dans votre contenu, votre balise titre (et votre description).
Il est préférable d’utiliser des mots-clés stratégiques dans les URL, plutôt que des nombres ou des éléments dénués de sens. En effet, comme je l’avais montré dans un test publié sur WRI, les moteurs tiennent compte de la présence de mots-clés dans les URL. Par contre, ne vous attendez pas à des miracles avec cette optimisation, ce critère étant peu pris en compte. En résumé : si vous le pouvez (aidez-vous de la réécriture d’URL), utilisez des mots ayant du sens dans vos URL.
Tant qu’à faire, évitez d’utiliser dans ces URL certains mots apportant trop peu de sens (les articles par exemple). Mais dans certains cas il est nécessaire d’en garder (soit parce qu’ils sont importants en terme de référencement comme dans La Rochelle
ou l’article La
est important, soit pour rendre l’URL compréhensible).
URL canonique (canonical URL)
L’URL canonique d’un contenu correspond en gros à l’URL officielle. Si jamais un contenu doit être publié à différentes URL, pour éviter les problèmes de contenus dupliqués il faut indiquer dans ces différentes URL laquelle est l’URL canonique. Ainsi, les moteurs de recherche peuvent décider d’indexer uniquement l’URL canonique.
Pour en savoir plus, lisez le guide de l’URL canonique.
L’URL dans WordPress et autres CMS : slug
Dans un CMS comme WordPress, l’URL d’un contenu dépend du slug que vous choisissez, c’est-à-dire la partie de l’URL qui correspond précisément à ce contenu. Par exemple pour l’article que vous lisez, le slug est url-et-referencement
.
Il est recommandé de bien choisir le slug et si possible de ne plus le modifier ensuite.
Reprise de l’arborescence / structure dans l’URL
Je vois encore beaucoup de monde qui s’imagine qu’il est préférable de faire apparaître l’arborescence des contenus dans l’URL. Je vais prendre l’exemple que je présente souvent en formation : des sites ecommerce qui vendent des barbecues.
La méthode traditionnelle est de reprendre l’arborescence du catalogue dans l’URL, similaire au fil d’ariane :
/nos-produits/jardin/barbecue-plancha-et-cuisine-exterieur/barbecue/barbecue-a-charbon-de-bois-1233.html
D’autres ont une approche bien plus simple : uniquement la catégorie, rien qui fasse référence au reste de la hiérarchisation des contenus dans le site :
/barbecue-charbon-3060
Voici les inconvénients du 1er exemple :
- si jamais on veut présenter la catégorie “Barbecue au charbon de bois” également dans une autre catégorie (par exemple fête des pères, ou n’importe quelle autre), on se trouve confronté aux problèmes de contenus dupliqués internes. Certes on peut les régler avec des canoniques ou autres astuces, mais ça complique pour rien.
- si jamais on veut renommer une catégorie mère, ou en fusionner plusieurs, ou en scinder en plusieurs, alors ça “casse” les URL de nombreuses catégories et sous-catégories. Même en faisant tout ce qu’il faut (mise à jour de liens internes et externes, redirections 301) c’est pas terrible pour le SEO.
- un peu trop longue, ça peut compliquer les choses (mais pas forcément le référencement naturel)
Le second exemple est bien mieux, il n’a aucun des inconvénients que je viens de citer. Par contre, surtout pour des gros sites, ça pourrait servir d’avoir un répertoire à la racine pour repérer facilement qu’il s’agit d’une page de type “catégorie”.
Remarque : le format de l’URL n’a pas de rapport avec la compréhension par Google de votre fil d’ariane. Un site utilisant le second exemple peut bénéficier d’un affichage “en mode fil d’ariane” dans les SERP :
Dans ma capture d’écran, les 3 résultats qui bénéficient de l’affichage du fil d’ariane dans les SERP n’ont pas choisi le même format d’URL : seul le 3ème a évité de reprendre l’arbo dans l’URL. Et le 4ème, qui inclut l’arborescence dans l’URL, n’a pas de fil d’ariane dans les SERP.
Notez que si vous souhaitez bien faire comprendre à Google le fil d’ariane, mieux vaut utiliser des données structurées (par exemple via schema.org).
Séparateurs de mots dans les URL
Pour séparer correctement les mots dans les URL, il faut utiliser des caractères interprétés comme des séparateurs par les moteurs de recherche. Je vous conseille de rester le plus simple possible et d’utiliser principalement le tiret (“tiret du 6”) et le point par exemple.
D’autres caractères fonctionnent en tant que séparateur, mais tenez compte des remarques suivantes :
- la virgule : un jour ou l’autre, vous aurez des problèmes car elle aura été mal interprétée. Egalement, vous aurez des soucis quand vous traiterez un fichier CSV contenant vos URL et d’autres données séparées par une virgule (c’est le cas d’un export des backlinks dans Bing Webmaster Tools).
- le point-virgule (;) : vous risquez d’avoir les mêmes problèmes qu’avec la virgule alors autant éviter
- la barre en biais (/ ou “slash”) ne pose pas vraiment de problème, à condition de faire attention à la notion de répertoire virtuel : pensez-y dans votre code HTML, quand vous faites référence à des fichiers (scripts, images) ou des liens.
- la barre verticale (| ou “pipe”) : à éviter car trop compliquée ! elle est très dure à taper au clavier et pas simple à expliquer à l’oral
- le signe pourcent (%) , l’astérisque (*) ou l’arobase (@) : pourquoi pas, mais autant rester simple non ?
N’utilisez pas le tiret bas (underscore : _ ou “tiret du 8”) car il n’est pas reconnu comme un séparateur (même si en voyant les SERP vous en avez l’impression).
N’utilisez pas le signe égal (=) et l’esperluette (&) qui sont plutôt à réserver aux URL dynamiques.
Ne vous fiez pas à la mise en gras de certains mots ou expressions dans les pages de résultats de Google, la gestion de l’affichage des résultats et l’algorithme de classement des résultats sont deux processus distincts. A une époque (vers 2006), Bing (MSN Search à l’époque) indexait rarement les pages dont l’URL comportait plus de 2 tirets. La situation semble s’être améliorée depuis.
Paramètres d’URL
Si vous avez des URL dynamiques et que vous n’utilisez pas la réécriture d’URL, il est probable que vos URL contiennent ce qu’on appelle des “paramètres”. Il s’agit de variables passées dans l’URL, comme par exemple le paramètre “page
” qui vaut “3” dans l’URL fictive https://example.com/articles.php?page=3
Ca ne pose pas forcément de problèmes ! Par contre, dans ce cas, Google vous propose de l’aider à “comprendre” ce qu’il doit en faire. Pour cela, consultez mon tuto sur le réglage des paramètres d’URL dans Search Console.
Longueur de l’URL
La longueur n’est pas un problème pour les moteurs, qui indexent des URL très longues. Par contre, ce n’est pas très pratique à exploiter, par exemple quand une URL est copiée dans un forum ou un blog, elle est souvent tronquée pour éviter de déformer l’affichage. Dans ce cas, les éventuels mots-clés qui la composent risquent de ne pas apparaître.
Je suis donc plutôt enclin à vous conseiller de créer des URL assez courtes.
La date dans l’URL
Faut-il mettre la date dans l’URL de ses articles ?
En général je déconseille de faire apparaître la date dans l’URL, car ça n’est pas indispensable et ça génère des problèmes quand on met à jour l’article. De nombreux blogs ont des URL avec la date comme /blog/2015/09/ici-le-titre
mais :
- quand vous mettrez à jour l’article en modifiant la date, l’URL sera cassée : il faudra prévoir des redirections, vous perdrez les partages sur les réseaux sociaux, etc.
- quand un internaute voit l’URL dans les résultats (ça peut arriver), il peut décider de ne pas cliquer, pensant que l’article est dépassé, même si ce n’est pas forcément le cas
Demandez l’avis de vos followers Twitter :
Le signe # dans les URL
Dans une URL, ce qui suit le signe # correspond traditionnellement à une ancre nommée, c’est-à-dire un signet interne à la page. On parle aussi parfois de “fragment”. Cela permet de faire un lien vers une partie d’une page. Par exemple voici un lien vers la rubrique du signe # pour les URL.
Certaines technos utilisent ce signe d’une autre façon (par exemple #! en ajax).
Soyez simplement conscients que pour les moteurs de recherche, tout ce qui suit le signe # est ignoré. Si des paramètres importants pour l’affichage du contenu sont passés derrière le signe #, cela risque d’être un problème pour votre référencement. Il y a néanmoins maintenant des exceptions avec Google et l’indexation d’Ajax et parfois aussi avec le robot de Google pour mobiles.
Extension : .html ou .htm ou .php ou .aspx ou aucune ?
Quelle extension faut-il utiliser dans les URL ?
Selon moi la réponse est simple : peu importe votre extension de fichier ! Vous n’êtes même pas obligé d’en utiliser (voyez l’exemple de Wikipédia). Ce n’est pas parce que cela se termine par .html qu’il s’agit d’un document HTML. Ce qui compte c’est que votre page soit effectivement codée en HTML (si possible sans trop d’erreurs !).
En choisissant de ne mettre aucune extension à la fin de l’URL, vous vous donnez plus de chances d’avoir une URL stable, quels que soient les CMS que vous utiliserez dans le futur. C’est donc mieux a priori.
Slash en fin d’URL
Faut-il mettre un slash à la fin de l’URL ? Dans tous les cas ou seulement pour certains types de contenus ?
Par exemple, prévoir /blog/ici-le-titre/
au lieu de simplement /blog/ici-le-titre
Certains assurent qu’il faut absolument “fermer” ses URL en ajoutant systématiquement un /
à la fin. Vous l’avez compris, je ne suis pas de cet avis (Wikipedia non plus semble-t-il, ça ne les empêche pas de cartonner en SEO…).
Par contre, comme pour le coup des WWW, une fois que vous avez décidé si vous mettez des slashes ou pas en fin d’URL, il faut vous y tenir. Redirigez les mauvaises URL vers les URL officielles.
Si c’est plus simple de toujours ajouter un /
en fin d’URL, ça ne pose aucun souci.
URL multiples
Si une page est accessible à deux URL (ou plus), il y a un risque de contenu dupliqué (duplicate content). Si un même contenu est accessible à plusieurs endroits, les moteurs de recherche tentent de déterminer ce qu’on appelle l’URL canonique, c’est-à-dire l’URL de la page la plus légitime (par exemple celle qui reçoit le plus de liens). Ils n’indexent alors que cette URL canonique, et n’indexent pas les autres (par exemple, Google a amélioré son algorithme à ce sujet à l’époque de la mise en place de BigDaddy). Le problème est qu’il est difficile de prévoir quelle URL va être retenue par les moteurs.
Par ailleurs, avoir une page accessible à plusieurs URL est mauvais également en terme de stratégies de liens, puisque l’optimisation s’éparpille sur plusieurs URL plutôt que de se concentrer sur une seule. Voilà pourquoi il faut faire attention de ne pas avoir d’URL multiples pour une page donnée.
A ce propos, comme l’indique SuperPJ dans les commentaires, si on utilise l’URL Rewriting, il ne faut pas oublier de désindexer les pages dynamiques ayant l’ancien format d’URL. Pour cela, le mieux est de rediriger de façon permanente (code HTTP 301) chaque ancienne URL vers la nouvelle équivalente. Si ce n’est pas possible, utilisez la balise URL canonique ou le fichier robots.txt. Dans le cas contraire, une même page sera accessible sur 2 URL ce qui posera des problèmes de duplicate content.
Accents, lettres diacritiques et autres caractères spéciaux dans l’URL
Même si des moteurs comme Google gèrent généralement bien les caractères spéciaux dans les URL, je vous déconseille d’en utiliser. Remplacez-les par leur équivalent non accentué, ça vous évitera bien des soucis.
Ceci concerne les parenthèses, accolades, apostrophe, guillemets, etc. ainsi que l’espace et les lettres diacritiques (accents).
Prenons l’exemple d’une page de Wikipédia avec un accent, par exemple /wiki/Numérique
. Même si certains navigateurs l’affichent avec l’accent, la véritable URL encode les caractères spéciaux. Par exemple, é
devient %C3%A9
si bien que mon exemple donne /wiki/Num%C3%A9rique
D’une part, vous perdez des mots-clés dans les URL (OK, ce n’est pas si grave que ça). D’autre part, cette URL devient “compliquée” et sera un jour ou l’autre mal interprétée. Par exemple, le signe %
sera à nouveau encodé, ou des espaces s’ajouteront.
En résumé : même si cela ne pose aucun réel problème en théorie, l’utilisation de caractères spéciaux (lettres accentuées par exemple) apporte trop de problèmes.
Mieux vaut les remplacer par un équivalent standard (une lettre accentuée par sa version non accentuée, un espace par un tiret, etc.).
Partagez ça sur Twitter :
Majuscules dans l’URL
Certains utilisent des majuscules dans les URL (souvent avec des technos Microsoft, je ne sais pas pourquoi). Là encore, à quoi bon utiliser des majuscules ? Que se passe-t-il si quelqu’un cherche à accéder à l’URL sans la majuscule que vous aviez prévue ? Parfois ça génère une erreur, parfois ça renvoie le même contenu que l’URL avec la majuscule (mais cela ne génère-t-il pas des contenus dupliqués ?), parfois il faut prévoir une redirection 301 vers la version avec majuscule.
Les majuscules dans les URL n’apportent rien, à part des ennuis ! Evitez-les…Click to Tweet
Bref, faites au plus simple, n’utilisez que des minuscules dans vos URL. C’est surtout pour être consistant, pour utiliser toujours le même format d’URL.
Petit bonus des URL pour AdSense
Si l’URL contient les mots-clés associés à la page, AdSense pourra s’en servir pour mieux cibler les publicités, mais c’est surtout pour les tout premiers affichages quand la page vient d’être publiée.
Cela étant, c’est évidemment mineur par rapport au contenu de la page…
Autres conseils SEO
Ce type de conseil d’optimisation du référencement fait partie des points abordés au cours des journées d’étude sur le référencement que j’organise régulièrement au sein de Ranking Metrics. Dans ce cas précis, c’est dans le 1er module (“A1”) que j’explique comment optimiser les URL pour le référencement.
Si j’ai oublié des éléments à prendre en compte pour bien optimiser ses URL pour le référencement, ou si certains points ne sont pas ou plus exacts, n’hésitez pas à me les indiquer en commentaires, j’essaierai de mettre à jour cet article. Merci à tous ceux qui ont joué le jeu et grâce à qui j’ai déjà complété mon article.
On en parle dans le forum : optimisation des URL pour le référencement
Autres questions
Le plus important est que l’URL soit stable (qu’elle ne change que très rarement). A part ça, il faut choisir des mots-clés, rester simple et assez court, en minuscule sans caractères spéciaux ni accents.
Pour choisir la meilleure URL possible d’une page, voyez sur le long terme et choisissez des mots qui décrivent bien le contenu de la page tout en restant simple.
L’URL Rewriting (réécriture d’URL) n’est pas indispensable en SEO mais c’est utile pour gérer des URL qui restent simples, stables et optimisées pour le référencement naturel.