La question récurrente : l’underscore, ou tiret bas, ou tiret du 8, est il un séparateur reconnu par Google ? Autrement dit, permet-il de différencier les mots.
Toujours pas, en tout cas à la date de ce test que chacun peut refaire facilement. 

Les séparateurs dans Google

C’est une grande question qui revient souvent ? Quels sont les séparateurs compris comme tels comme Google ? Le +, la , et le – sont compris. Reste la grande question du _ , appelé tiret bas, tiret du 8 ou underscore. 

A un moment, en septembre je crois, Matt Cutt avait annoncé que Googly y travaillait. Et que ce serait pour bientôt. Mais rien de nouveau depuis, aucune annonce. 

J’avoue que sur le fonds, ce n’est pas une question qui me turlupine. Je me vois mal mélanger – et _ dans une url, donc il suffit de choisir le -, et de s’y tenir. 

Mais, après une petite discussion sur un forum de webmaster, j’ai décidé de faire un test. Juste un petit test, qui passera par mon blog, parce qu’il « ping » bien et que ses billets sont rapidement indexés. 

La méthode du test est assez simple : prendre six mots, non présents dans Google (ma créativité a été mise à rude épreuve), et faire trois posts :

  • le premier post aura comme identifiant deux mots, séparés par un tiret normal
  • le deuxième aura comme identifiant, et donc comme url, deux mots séparés par un tiret bas
  • le troisième post aura comme identifiant deux mots séparés par un tiret bas, et ces deux mots se retrouveront dans le titre et dans le texte

Pourquoi ?
La discussion est partie de la présentation des résultats de Google. Une page avec une url « à tiret bas » avait été indexée. Mais de nombreuses ancres pointaient sur elle avec les mots clés, normalement séparés, un titre comportant ces mots clés, et les mots dans l’url étaient mis en gras. 

Pour moi cela ne prouve rien : Google utilise certaines informations quand il indexe une page, et détermine les mots sur lesquels il va la positionner, mais n’utilise ni les mots clés, ni par exemple les balises titre. En revanche, une fois que la page est indexée, il va mettre en gras toutes les occurrences du mot dans la page, même parfois à l’intérieur d’un mot… ou de l’url.

En clair, une page positionnée sur Melchior peut éventuellement montrer dans les résultats de recherche le mot amonmelchiorchou avec melchior mis en gras à l’intérieur du mot. Ce n’est pas pour cela que Google a été capable d’individualiser melchior dans le mon amonmelchiorchou. 

D’où ce test… 

Birzotandon et siririppe

Voici donc le troisième post de cette série de test. J’ai déjà indexé des billets sur leur titre seul, ou presque, donc celui ci devrait sortir sur birzotandon et siririppe. Mots soigneusement inventés, et j’ai vérifié que Google ne connaissait ni birzotandon, ni siririppe. 

Le siririppe serait un oiseau

En tout cas c’est ce que ce mot m’évoque, un petit rossignol des forêts américaines, dont le chant a directement donné le nom. En revanche, pour le birzotandon aucune idée, peut être un mammifère fluvial un peu pataud ? Qu’en pensez-vous ? 

Sur le fond, de toutes façons, je n’aime pas trop le tiret bas comme séparateur. Premièrement il n’est pas facile à nommer, et cela rallonge donc d’autant l’url quand on la « dicte » ce qui arrive encore. Ensuite, pour des problèmes de lisibilité, car il est invisible, quand l’url est soulignée, ce qui est le comportement par défaut dans les navigateurs. C’est plus un truc de technicien, une façon de transformer l’espace en un signe typographique équivalent, mais ce n’est pas un réflexe chez l’utilisateur normal. 

Il reste donc à attendre que ces billets s’indexent. Ils sont pingués à la création, le temps moyen est de quelques heures. Je vais m’abstenir d’envoyer requête sur requête à Google, et attendre de voir si mes birzotandon, siririppe et autres mots clés ressortent dans les résultats. 

Les résultats attendus

Avec ces trois pages, auxquelles je donne un contenu différent, et réel, d’où les trois posts, je devrais avoir les résultats suivants, si effectivement le tiret bas n’est pas un séparateur : 

  • la page identifiée avec deux mots séparés par un tiret normal est indexée
  • la page avec deux mots pas présent ailleurs dans le code, et un tiret bas, n’est pas indexée
  • la page avec deux mots séparés par un underscore et présents dans le code, est indexée. Les mots sont mis en évidence dans l’url

En revanche, si l’underscore est compris comme un séparateur, la deuxième page sera aussi indexée, et je mange mon chapeau. 

Il est bien sûr indispensable de choisir des mots qui n’existent pas dans Google. C’est la seule façon possible d’arriver à positionner sur un résultat donné une page avec les mots clés présents uniquement dans l’url. Et même, cela ne va pas être simple : c’est donc l’intérêt de la première page, qui permettra de voir si une page qui contient des mots uniquement dans son url, peut être indexée dessus. Avec de vrais mots, déjà présents dans l’index, ce serait mission impossible. 

Quel que soit le séparateur, n’abusez pas et ne mettez pas de très longues phrases : d’abord pour la lisibilité de vos urls, et ensuite parce qu’il semble que Google s’arrête au deuxième – séparateur. C’est d’ailleurs pour cela que j’utilise systématiquement l’identifiant quand je créé mon article, pour éviter les urls à rallonge créées automatiquement par WordPress. 

Le poids de l’url dans le positionnement est aussi une question débattue. Il semble que le nom de domaine avec des mots clés soit un gros avantage, et que pour la suite de l’url, cet avantage soit beaucoup plus léger. D’une façon générale, Google accorde de moins en moins d’importance aux balises « manipulables » sans impact direct sur l’internaute normal, comme les keywords, ou la balise title. La balise description est en discussion : certains pensent qu’elle n’est plus utilisée dans le positionnement, juste dans l’affichage des résultats, mais Google y accorde beaucoup d’attention, prévenant dans ses outils pour webmasters, quand elle est trop courte, ou répétitive, d’une page sur l’autre. Le nom d’un fichier est aussi un des éléments facilement manipulable par le webmaster, donc je pense qu’elle n’a pas un gros impact. 

Test de séparateur – Les résultats.

Indexée en quelques minutes ! 

Les résultats confirment, l’underscore n’est toujours pas un séparateur compris par Google. 

La page comprenant un tiret dans son titre a été indexée

Rappel : aucun des deux mots de l’url n’est présent dans le code.
Seul le premier mot a été indexé par Google. La place des mots dans l’url compte. 

La page comprenant un underscore dans son titre a été indexée sur la totalité du titre seulement

Aucun des deux mots n’est renvoyé par une recherche. Le « mot » composé avec l’underscore renvoie la page. 

La page comprenant un underscore dans son titre et les mots dans le texte a été indexée

Les mots sont mis en évidence dans l’url, mais l’autre page permet de savoir que les mots individuels dans l’url n’ont pas été pris en compte dans l’indexation

Conclusion : l’underscore n’est toujours pas interprété comme séparateur de mot par Google

Les trois articles, qui détaillent le test :