Retour au blog
éviter les erreurs avec la balise CANONICAL

Zoom sur … la balise canonical

Qu’est ce que la balise canonical ?

C’est une balise intégrée dans le code html d’un site qui indique aux robots des moteurs de recherche qu’elle est l’URL / page référente pour un ensemble d’URL / pages données .

La balise déterminera la page canonique c’est-à-dire la version principale pour la différencier du contenu dupliqué, contenu proche ou pages similaires.

Elle résout ainsi tous les problèmes de contenus dupliqués ou similaires à une URL.

Comment se matérialise t-elle ?

La balise canonical ressemble à ceci :  
<link rel=”canonical” href=”https://www.site-exemple.com/” />

href=https://www.monsite-exemple.com/ représente l’URL canonique.

L’ensemble s’intègre dans la partie <head> du code HTML de chaque page de contenu dupliqué et peut même être mise en place dans le code de la page principale pour faire référence à sa propre URL.

Ainsi les robots auditeront directement la page principale et non les pages de contenu dupliqué qui seront non indexées.

Pourquoi mettre en place une balise canonical et comment ça marche ?

Pour éviter le problème de duplicate content qui est une pratique peu apprécié par Google et peut jouer défavorablement sur les positionnements dans les SERP et donc sur une stratégie SEO !

Considérons que ces 4 pages présentent des contenus similaires. La page mère c’est-à-dire au contenu canonical (original) est monsiteweb.fr/products. Les trois autres pages produits sont des pages dites filles qui reprennent en grande partie le contenu de la page principale. Sans balise canonical, Google va les considérer comme des pages identiques au contenu dupliqué ce qui va impacter de façon négative le budget crawl  (temps que passe Google à analyser et auditer un site) et donc pénaliser ses pages dans leur classement.

On retrouve beaucoup ce cas sur des sites e-commerce car, suivant les produits et leurs spécificités, le contenu peut être similaire à quelques variantes près non vu par les robots Google.

C’est pourquoi il est important d’intégrer une balise canonical dans chaque page « filles » faisant référence à l’URL de la page « mère » dont le contenu a été dupliqué ; on l’appelle l’URL canonical.

Quelle est la différence avec une URL canonique ?

D’après la définition de Google Search Console « Une URL canonique est l’URL de la page considérée par Google comme la plus représentative de l’ensemble de pages dupliquées sur votre site ». Autrement dit, une URL canonique correspond à l’adresse web ou URL d’une page originale afin de signaler aux moteurs de recherche que cette page sera la seule à être indexée si d’autres pages présentent le même contenu.

Cette URL est intégrée dans la balise canonical pour prévenir que la page est canonique et que c’est elle qui devrait être indexée et positionnée dans les moteurs de recherche.

Top 4 des erreurs à éviter

  • Mettre la balise canonical dans une autre partie du code html autre que le <head>. Attention, dans ce cas, elle ne sera pas vu par les boots et par conséquent elle n’aura aucun utilité.
  • Intégrer à la fois une balise canonical et une balise noindex. C’est inutile car l’insertion d’une balise canonical désindexe, par essence, la page au contenu dupliqué.
  • Dans le cas de contenus paginés sur un site e-commerce par exemple, insérer une balise canonical depuis la page ?p=2 vers une page P est une erreur. Veillez à bien renvoyer votre canonical vers la page active. Soit dans ce cas ?p=2.
  • Ne pas bien écrire l’URL de la page canonique. Toute faute dans l’écriture de l’URL (y compris depuis le http) peut être fatale dans la compréhension et la lecture de la balise par le robot.

La balise canonical, on la connait bien chez Ki-Noz ! Des conseils, un accompagnement sur des problématiques SEO ? N’attendez plus pour nous contacter, nous discuterons avec vous de vos projets.