Regardant de façon détaillée les avertissements de Google Webmaster Tools pour un de mes blogs, je découvre des meta title et descriptions dupliquées pour une trentaine de pages. Il s’agissait en fait de pages de catégories, accessibles via deux urls :
-www.exemple.com/category/categoriemère/deuxièmecatégorie/lacatégorie
et
-www.exemple.com/category/lacatégorie
(category étant le préfixe standard des permaliens des catégories).
C’était très fâcheux.
En plus des titles et descriptions dupliquées, bien sûr le contenu l’était aussi.
Comme j’avais en tête de refaire le thème, j’ai un peu laissé tomber.
En m’y mettant hier, j’ai découvert la source de mon problème, WordPress lui même, qui ajoute obligatoirement la hiérarchie des catégories dans le permalien. Et pas moyen de modifier cela dans les options elle-mêmes.
Là ça commençait à fortement me déplaire.
Parce que, outre le duplicate content, cela voulait dire que je devais figer ma liste de catégories et sa hiérarchie, ou risquer les erreurs 404.
Ca me semble aberrant : ainsi le contenu de ce blog s’étoffe peu à peu, et je ne vais pas avoir autant de catégories maintenant que lorsqu’il aura mille ou deux mille articles.
De plus, il est tout à fait possible de créer une catégorie à la volée en écrivant un article, et dans ce cas elle est à la racine. Il suffit que je tarde un peu, pour n’importe quelle raison, à la réintégrer à sa juste place dans la hiérarchie, pour que Google ait déjà indexé sa page, et se retrouve donc en 404 au prochain crawl.
Enfin, c’est un générateur d’url à rallonge. Non seulement pour les catégories elle-mêmes, mais pour les articles aussi, si l’on utilise dans le permalien la catégorie, comme beaucoup de blogs le font. (Et là, une mulltiplication encore plus grande des 404 si vous changez la hiérarchie des permaliens).
A chaque problème sa solution : un plugin, Single Category Permalink, par Scott Reilly. Aussi tôt trouvé, aussitôt installé, il ne reste plus qu’à paramétrer dans le .htaccess les redirections 301 des anciennes url des catégories.


















C’est un défaut commun à tous les blogs, si je comprends bien, non ?