URL canonique : définition et paramétrage de vos URL

URL canonique

Il arrive fréquemment que, sur un site internet, des pages Web ou toutes autres ressources Web indexables (documents Word, PDF, vidéos, images, etc.) soient accessibles à partir de plusieurs URLs. 

Lorsque cela arrive, il est primordial de prendre des mesures correctrices, afin de pallier les problèmes de contenus dupliqués.

Dans ce tutoriel,

Qu’est-ce qu’une URL canonique ? À quoi sert-elle et surtout comment la mettre en place ?

C’est ce que je t’invite à découvrir dans ce tutoriel complet où je vais te montrer comment mettre en place une URL canonique efficace pour doper ton référencement naturel.

Prérequis : ce qu’il faut savoir sur l’URL et sur le contenu dupliqué 

  • L’URL 

L’URL (pour Uniform Resource Locator) désigne l’adresse internet unique correspondant à une page Web. Elle est du  format « www.tonsite.com » ou « http:tonsite.com/contenu » ou « https:tonsite.com/contenu ». 

  • Le contenu dupliqué 

Pour sa part, le contenu dupliqué – ou duplicate content en anglais – intervient lorsque 2 pages web, possédant donc des adresses internet différentes, présentent un contenu (strictement ou quasi) similaire. 

La duplication du contenu peut être externe : lorsqu’elle est faite en recopiant les ressources d’un site tiers. 

Dans ce cas et contrairement à ce qui est souvent dit, il n y a pas de véritables sanctions. Car ne faisant à priori aucune différence entre le contenu original et le contenu plagié, les moteurs de recherche se contentent de positionner la page qui parait la plus pertinente à leurs « yeux ».

Sur Google, par exemple, il est toutefois possible de demander qu’une page Web portant atteinte à ses droits d’auteur soit supprimée des résultats de recherche en envoyant une demande DMCA (Digital Millennium Copyright Act).

La duplication du content peut aussi apparaître en interne : par exemple sur un site internet, un article peut être consultable à la fois :

Tu as noté la différente ? Googlebot et compagnie, eux, l’ont bien remarquée : la dernière barre oblige. 

Résultat : URLs différentes + contenu identique = 2 pages Web. La Search Console te signale alors que les titres et les descriptions sont dupliqués. 

Dans une telle situation, deux cas de figure sont possibles :

  1. Tu ne fais rien : Google et les autres moteurs de recherche choisissent l’URL canonique à ta place. Et les autres URLs sont considérées comme des URL en double et sont explorées le moins souvent que possible, afin de réduire la charge d’exploration de Google (notamment) sur ton site. Ou même pire, toutes les pages similaires sont considérées égales. Ce qui pourrait entraîner un comportement indésirable (comme on le verra un peu plus loin).
  2. Tu indiques explicitement laquelle des URLs est l’URL canonique. Google et les autres moteurs de recherche la considèrent et la traitent comme-t-elle. Sauf si l’une des versions doubles répond plus précisément à la requête d’un internaute. Par exemple, sur Google, le résultat de recherche redirigera probablement vers la page mobile si l’utilisateur utilise un support mobile, même si la page canonique est la version classique.

Définition de l’URL canonique 

L’URL canonique – ou canonical URL en anglais – est une balise permettant de déterminer l’adresse officielle d’une page Web dupliquée. En d’autres termes, c’est une indication fournie aux moteurs de recherche par le webmaster pour définir sous quelle URL une page Web reproduite doit être indexée.

Plus concrètement, c’est l’URL de la page considérée par les moteurs de recherche comme la plus représentative de l’ensemble des pages dupliquées d’un site Web. 

En résumant grossièrement, en 4 points : 

  • Si une page de ton site est consultable à partir de 2 URLs, cela crée un problème de contenu dupliqué. 
  • En définissant une URL canonique en faveur de celle-ci, tu indiques l’adresse internet sous laquelle elle est censée être trouvée. 
  • Alors, toutes ses autres versions sont considérées comme étant exactement la même page. 
  • Et la gêne du contenu reproduit est écartée. 
Note 1 : L’URL canonique est prise en compte par les principaux moteurs de recherche. 
Note 2 : URL canonique = adresse canonique = page canonique = balise link rel=canonical. 

URL canonique : ça sert à quoi ? 

Comme nous venons de le voir, la balise link rel=canonical permet de corriger les problèmes de contenus dupliqués. 

Pour te permettre de prendre toute la mesure de son utilité, je te propose de visualiser le panorama ci-après : 

  • Une page Web est identifiée grâce à son adresse internet (oui, ça, tu le sais !). 
  • Pour explorer et indexer un site Web, les robots d’indexation, tels que Googlebot, considèrent qu’une URL = a une et une seule page spécifique. 
  •  Lorsqu’une page Web est alors accessible à partir de plusieurs adresses internet, 2, par exemple, elle est considérée par défaut comme 2 pages bien distinctes et apparaît 2 fois dans l’index des araignées du Web.   
  • Lorsqu’une page Web reproduite reçoit des liens retour (backlinks) dans chacune de ses différentes versions, l’autorité (ou le jus) potentielle de cette dernière est divisé(e) par n (n étant le nombre d’URLs).    
  • Puisque la page Web originale est mise en concurrence avec les autres formats d’URLs, cela participe à une sorte de cannibalisation.
  • D’où la nécessité d’implémenter, dans un tel cas, une URL canonique, afin d’indiquer à Google et aux autres moteurs de recherche l’adresse internet qui doivent afficher dans les SERPs. 

Par ailleurs, plus un site multiplie ses URLs à crawler par n, plus il est susceptible d’essuyer des pertes de crawl budget.

Note : quand plusieurs URLs affichent strictement le même contenu, on parle de Duplicate URL Same Text (DUST).

Comment limiter la duplication interne de ton contenu ? 

Jusqu’ici, aucune solution ne permet d’éviter durablement que le contenu d’une page Web ne soit dupliqué en externe. 

Toutefois, pour prévenir l’auto-cannibalisation sur ton site, différentes précautions existes : 

Les Do : 

  • avoir un site bien construit ; 
  • encadrer la gestion des identifiants de session ;
  • régler les paramètres de tracking et d’affiliés avec grand soin ;
  • adopter les bonnes pratiques pour assurer la compatibilité de son site avec plusieurs types d’appareils ; 
  • etc.  

Les DON’T : 

  • avoir des articles (ou des produits, pour un site d’e-commerce, par exemple) qui apparaissent dans plusieurs catégories ;  
  • négliger la structuration et le paramétrage des pages de son site internet ; 
  • procéder à la réécriture systématique de ses URLs ;
  • avoir un serveur configuré pour diffuser le même contenu pour les variantes www/non-www et HTTP/HTTPS ;
  • etc. 

Ceci dit, il est parfois difficile, voire impossible de respecter tous ces impératifs du Web. D’où l’importance de savoir comment mettre une URL canonique en place. 

Mais, avant de voir le comment, si tu es d’accord, voyons d’abord les réponses à quelques questions régulièrement posées.     

Quand as-tu besoin d’utiliser une URL canonique ? 

  • Lorsque tu as des identifiants de session situées dans tes URLs.   
  • Lorsque tu gères le tracking (flux RSS, affiliation, etc.). 
  • Lorsque tu as des pages Web qui sont consultables via des URLs différentes. 
  • Lorsque tu gères du contenu syndiqué (publié sur d’autres domaines). 
  • etc. 

Comment implémenter une URL canonique ? 

Pour définir l’adresse canonique d’un ensemble en double, tu as le choix entre 2 méthodes de mise en forme canonique : 

  • Insérer la balise link rel=canonical dans ton code HTML

Ou, plus précisément, dans l’entête HTML de toutes les pages qui partagent le même contenu, entre <head> et </head, en suivant le formalisme suivant : 

<link rel= »canonical » href= »URL » /> 

Illustration : 

Note : comme son nom l’indique, cette méthode fonctionne uniquement avec les pages HTML. Pas avec les documents .doc, PDF, par exemple. 

  • Insérer une balise link rel=canonical dans ton entête HTTP

Pour appliquer une URL canonique, tu peux aussi insérer une ligne dans ton entête HTTP, par une directive dans ton fichier .htaccess, par exemple. 

Attention toutefois, ici, la syntaxe est un peu différente : 

Link : <URL>; rel= »canonical »

En reprenant la précédente illustration, ça donne exactement ceci : 

Link: https://blog.dotmarket.eu/strategie-de-contenu/importance-intentions-de-recherche/ ; rel= »canonical »

D’après Google, cette méthode présente plus d’avantages :

  • N’augmente pas la taille de la page ; 
  • Permet de mettre en correspondance un nombre infini de pages dupliquées. 

Et moins d’inconvénients : 

  • Gestion de la mise en correspondance laborieuse sur les sites volumineux ou sur ceux dont les pages changent fréquemment d’URL.
Note : tu peux aussi définir tes pages canoniques dans un sitemap.

Maintenant que tu sais comment définir une URL canonique, nous pouvons voir comment les vérifier. 

Comment tester une URL canonique ?  

En 3 étapes : 

  1. Au moyen d’un Web crawler qui suit les liens de page en page comme les robots d’indexation des moteurs de recherche, explore les URLs de ton site internet de fond en comble. 
  2. Après les avoir toutes recensées, contente-toi d’analyser celles qui renvoient un code 200 (signalant qu’elles fonctionnent bien).
  3. Pour chacune d’elles : 
  • Extrait l’URL canonique (dans le code HTML ou dans l’entête HTTP, en fonction de l’endroit où tu l’as définie).
  • Compare l’adresse internet de la page indexée à l’URL canonique ainsi extraite. 
  • Si elles sont strictement identiques, c’est bon, la balise d’URL canonique fournie est juste et accessible. 
  • Par contre, si l’URL canonique renvoie un code 404, 410, 500, etc., (signalant qu’elle est inaccessible) il y a un problème, il faut le résoudre.  
  • Si encore, l’URL canonique renvoie un code 301, 302, etc., (signalant qu’elle est redirigée ailleurs) indique directement la bonne URL finale. 

Quelles sont les erreurs récurrentes en matière d’URL canonique ?

Grosso modo, il y en a 8 :

  • Utiliser le fichier robots.txt pour la mise en forme canonique 

C’est proscrit. 

  • Configurer une même adresse canonique pour des pages au contenu différent 

Cette erreur ne fera que saborder les performances globales de ton site en matière de référencement ; en délitant la visibilité de certaines de tes pages. 

  • Ajouter plusieurs liens canoniques sur une seule et même page

À moins que tu essaies vigoureusement d’embrouiller les moteurs de recherche, ne définis pas différentes URLs canoniques pour la même page. Et ce peu importe que la méthode utilisée soit la même ou non. 

Par exemple : appliquer une URL canonique dans un sitemap et définir une URL différente pour la même page avec l’attribut rel= »canonical ». 

Qu’est ce qui se passerait si tu le faisais ? Eh bien, cela obligerait les moteurs de recherche à procéder à un arbitrage d’URL, bien entendue, selon leurs propres critères, au risque de choisir l’URL canonique la moins optimisée. 

  • Appliquer une référence canonique non-indexable

En effet, il arrive souvent que, par erreur, le webmaster fournisse une adresse canonique non-indexable. Quand on sait que la « solution canonique » est justement conçue pour améliorer le SEO, cet impair est à éviter absolument.   

  • Utiliser l’outil de demande de suppression d’URL pour définir une URL canonique 

Utiliser l’outil de demande de suppression d’URL pour la mise en forme canonique ne fera que supprimer toutes les versions d’une URL de la recherche.

  • Définir une adresse canonique sur les pages de pagination

Bien que ce soit possible, il est déconseillé d’utiliser une balise d’URL canonique dans la configuration de contenus devant s’afficher sur plusieurs pages. Donc, au lieu de mettre une URL canonique sur la 1ère page, autorise l’accès à chacune d’elles aux crawls. 

  • Utiliser la balise noindex

Une autre maladresse consiste à utiliser la balise noindex. Car elle empêche la sélection d’une URL canonique. 

  • Inverser les rôles entre une page principale et une page secondaire

Comme dernière « erreur canonique », il est possible de se confondre dans le choix de son URL officielle, en fournissant l’URL de seconde zone à la place de l’adresse internet favorite.  

FAQ : les 12 questions les plus courantes sur la balise link rel=canonical

  • Qu’est-ce qu’une canonicalisation ?

C’est le processus par lequel un webmaster implémente une balise link rel=canonical commune à plusieurs URLs ayant le même contenu en partage. 

  • La balise d’URL canonique est-elle une directive ?

NON ! C’est simplement une indiction qui permet de préciser sous quelle adresse internet une page Web doit être crawlée. 

  • La balise link rel=canonical est-elle une solution optimale ?

En plus de son utilité, l’URL canonique est relativement simple à manipuler et sa mise en place ne requiert aucune compétence spécifique ou technique. C’est juste une application « bête » de la formule. 

Donc, de ce point de vue, oui, c’est une bonne solution. 

Seulement, voilà : la balise link rel=canonical agit uniquement comme un palliatif. Autrement dit, l’application d’une URL canonique suppose l’existence d’un problème en amont : le duplicate content. 

Le défi majeur reste donc d’éviter d’avoir des pages consultables depuis plusieurs URLs en interne. 

Oui ! l’URL canonique est une bonne solution. Mais moins on est obligé de l’utilise mieux c’est. 

  • La balise link rel=canonical est-elle compatible avec la pagination ?

Oui, mais. Pour inclure l’URL canonique dans les pages de pagination, il faut absolument suivre les directives données par Google. Et, de toutes les façons, comme nous l’avons vu dans la section des erreurs à éviter, il est préférable de laisser toutes les pages être indexées. 

  • Comment définir une balise link rel=canonical avec Joomla ?

De plus en plus de plugins permettent d’implémenter une URL canonique avec Joomla. C’est le cas, par exemple, des extensions SEO « EFSEO – Easy Frontend SEO » et « Sh404SEF ».

  • Comment gérer une balise link rel=canonical sous WordPress ?

Toujours au moyen de certains plugins. Il s’agit, par exemple, de « All In One SEO », de « Yoast SEO » ou de Rank Math qui te permettent de directement paramétrer cette URL dans leurs champs sur ton dashboard.

Exemple réglage canonical sur RankMath
  • Comment définir une balise link rel=canonical dans Drupal ?

En utilisant des extensions, oui, là aussi. 

Exemple : Metatag. 

Ce module permet de renseigner son URL canonique directement dans l’édition d’un contenu. Pratique ! 

  • Faut-il utiliser un chemin d’accès relatif ou absolu ?

Pour ne prendre aucun risque lié au chemin d’accès relatif, il est conseillé de toujours préférer une URL absolue (celle qui commence par « http:// » ou « https:// ») pour les URLs canoniques. 

Voici ce que Google dit à ce sujet : « Nous préférons définir une page HTTPS comme canonique plutôt que son équivalent HTTP, sauf en cas de problèmes ou d’indicateurs contradictoires. » 

  • Comment vérifier qu’une URL canonique est prise en compte par Google ? 

 En utilisant l’outil d’inspection d’URL de la Search Console.

  • L’URL canonique peut-elle se trouver sur un nom de domaine différent ?

Affirmatif. La balise d’L’URL canonique peut très bien se trouver sur un domaine différent de celui d’une URL en double.

  • Peut-on marquer des pages ayant un contenu légèrement différent par une même URL canonique ? 

Oui. Mais uniquement si les différences constatées sont infiniment mineures. Dans le cas contraire, les robots d’indexation se feront le plaisir de crawler les différents formats d’URLs.

Conséquence : ils se retrouveront tous dans l’index des moteurs de recherche. Seules 2 pages Web ayant un contenu identique ou quasi similaire peuvent utiliser la même URL canonique.

  • Est-il possible d’auto-désigner l’URL d’une page Web en canonique ?

Absolument. Cela est possible. Tu peux en effet directement indiquer en canonique l’URL « normale » d’une page Web. Seulement, avant d’adopter cette prévention, assure-toi de n’avoir pas prévu d’autres versions d’URLs permettant d’accéder à ce même contenu.

Il vaut la peine de noter que définir une URL canonique n’est pas indispensable. Car les moteurs de recherche se chargeront eux-mêmes de déterminer en canonique la page qu’ils considèrent plus complète et plus utile.

Toutefois, pour les raisons que tu connais désormais, il est préférable d’indiquer sous quelle adresse internet une page Web doit être indexée. 

Quelle est la meilleure alternative aux URLs canoniques ? 

Comme mentionné tout au long de ce tutoriel, l’idéale est vraiment de t’assurer que chaque contenu de ton site Web soit toujours accessible à partir d’une seule et même URL.

Toutefois, s’il arrivait que tu doives corriger un problème de contenu reproduit, en dehors de l’URL canonique,  tu peux également appliquer la bonne vielle redirection 301

À priori, c’est plus efficace. À priori, c’est meilleur pour le SEO. Car, n’oublie pas, le code 301 permet de transmettre 90 à 95 % de l’autorité d’une ancienne page vers la nouvelle. 

Ceci dit, l’usage de la redirection côté serveur 301 est exclu dans 2 situations :

  • si la redirection va conduire à un ralentissement du temps de chargement de la page ;
  •  si la page qui contient le contenu dupliqué doit immanquablement être consultée par les internautes. 

En un mot, utilise cette méthode lorsque tu souhaites supprimer les pages doublons tout en assurant une transition fluide. 

Ce qu’il faut retenir sur l’URL canonique   

Si tu vises la 1ère place dans les pages de résultats de recherche, évite de mettre tes pages Web en concurrence entre elles. 

Idéalement, une page Web ou toute autre ressource Web indexable (document Word, PDF, vidéo, image, etc.) doit être accessible à partir d’une adresse internet (URL) unique. 

Ce qu’il faut retenir sur l’URL canonique, c’est que, bien optimisée, elle te permet de garantir que tous les liens internes de ton site mènent directement vers une page de destination préférée.

Comment ? En indiquant aux moteurs de recherche sous qu’elle URL une page dupliquée doit être indexée.  

Des questions sur le sujet ? Poses-les en commentaires comme toujours je serai ravi d’y répondre !

About the author

Kévin JOURDAN

Editeur de site internet, blogger (sur Kjourdan.com), consultant SEO, conférencier & co-fondateur de l'agence de RP Digitale & Netlinking OnAcceleration, Kévin a développé La Markerplace pour réunir investisseurs et vendeurs de business en ligne de qualité. Un endroit de rencontre créé à la hauteur de ses standards et à l'image de la façon dont il aime travailler : efficace, fiable et humain !