Trouver les liens dans Google
Il est notoire que la commande “link” dans Google est bridée, et ne donne qu’une petite partie des liens pointant sur un site.
Depuis quelques temps, j’ai le même problème avec Yahoo.
Mais il existe un moyen facile de trouver une bien plus grande partie des liens indexés pour un site, dans Google, en utilisant la recherche avancée.
Pour trouver les liens vers le site exemple.com il suffit de taper
exemple.com -site:exemple.com
Sur les sites que je gère (et où j’ai donc la possibilité de comparer avec la commande links de la console Google Webmaster Tools), cette recherche me donne entre 80 et 95% du nombre de liens dans GWT. contre 5% pour la commande link !
Sauf erreur de ma part, ça ne cherche que les pages qui utilisent le texte “exemple.com”
Ca marche donc surtout pour chercher les BL d’une homepage car elle reçoit pas mal de BL avec le nom de domaine comme anchor text (d’après une de mes vieilles études c’est ~30% des BL dans le cas des homepages)
Mais je ne suis pas certain à 100% de mes dires alors si vous avez des contre exemples je suis preneur
Mais c’est vrai ! Et les réponses ne sont pas identiques : plus précises ?
Sauf, Olivier de WRI, que si tu remplace “exemple.com” par ton libellé d’url -comme je le fais dans ma Revue ce soir – tu as, en effet, des réponses sur le site et pas sur un mot. Maintenant, oui, il faudrait tester avec les commandes site et inurl … Bref, ce test serai à compléter ;)
Bonsoir Olivier (de WRI)
Voici deux pages trouvées avec la requête mezgarne.com -site:mezgarne.com
Sur la première, il y a un lien sur une page profonde, je crois donc qu’il n’est pas nécessaire de rajouter le joker (ce qui voudrait dire que le / est considéré comme un séparateur … pour rebondir sur une autre discussion)
Sur celle ci, le .com n’apparait pas dans le texte, uniquement dans le code source
@ Olivier SC (pas de WRI) je pense que la différence entre les deux provient de l’index utilisé. Jean Véronis avait bien montré que Google n’utilisait pas toutes les pages de son “index” pour les résultats, le compteur de GWT doit être plus complet.
Sur la page je ne vois pas le lien vers mezgarne.com
la page sort sans doute car elle est bien optimisée pour le mot Mezgarne et qu’elle contient aussi .com
Excellent merci !
J’ai fait un site pour lequel la commande link ne pointait que 7 pages !!!!!!!!!! Avec ton “truc” j en arrive a plus de 240 :) Ce qui me rassure tout de meme sur mon travail de referencement
Bone journee
De tête, il me semble que le sitemap Google te donne également toutes ces infos. En tout cas, merci pour le tip
Coucou Marie-Aude,
Je constate que cette commande est inexploitable pour les NDD formés d’un (ou plusieurs) mot(s)-clé(s) générique(s) et très répandus car Google n’est pas en mesure de différencier mon site de ceux des concurrents.
Exemple (ne me concernant pas mais illustrant bien mon problème) : voyage.com -site:voyage.com
@Bertimus :
Tu peux peut-être utiliser une requête de ce type :
“www.voyage.com” -site:voyage.com
@Olivier
Le “mezgarne.com” est en alt du lien mou (méthode intéressante d’ailleurs)
Il est clair que la recherche ne permet pas de sortir les liens (il faudrait voir si on peut construire quelque chose de plus sophistiqué avec les jokers), mais ressort bien les pages avec le texte exemple.com dans le code.
Elle inclue donc quelques cas “bizarres”, et ça reste une approximation.
@Thibaut
Pour ses propres sites, rien ne vaut GWT.
En revanche, pour “espionner” la concurrence, c’est bien utile.
@Bertimus, oui je pense comme Reglisse, essaie avec les guillemets.
La méthode utilisée est bonne, toutefois il faut vraiment mettre le premier entre guillemets, comme le fait remarquer Reglysse.
Marie-Aude, désolé d’insister, mais je ne vois que ça :
alt=’http://www.oasisdemezgarne.com’
donc aucun rapport avec le site mezgarne.com
je me trompe ?
ce que je veux souligner, c’est que la technique que tu mentionnes a l’avantage d’aider à trouver d’autres liens, certes, mais elle fournit aussi beaucoup de “fausses alarmes”, c’est-à-dire de pages qui ne font pas de liens.
il y a plusieurs années que j’ai parlé de cette technique (voir http://www.webrankinfo.com/outils/citations.php ), et j’avais même développé un petit outil basé sur l’API Yahoo, mais il ne marche pas toujours super bien : http://www.webrankinfo.com/outils/citations.php
Du grand n’importe quoi cet article.
Vérifiez un peu vos dire avant de vous avancer et de faire de la véritable désinformation.
1 – GG compte les BL des sites. Tous ? Aucune preuve.
2 – GG offre via ses GWT un total de ces BL. Tous ? Aucune preuve.
3 – la commande link est bridée depuis des années.
Voilà les seuls vrais choses que l’on peut affirmer.
J’apprécie beaucoup les gens qui qualifient un article de “n’importe quoi” avec des arguments qui prouvent qu’ils n’ont pas lu cet article.
Je n’ai jamais prétendu qu’aucune méthode donnait tous les liens, mais qu’une syntaxe de recherche permettait une bien meilleure approche que la commande “link”. J’ai même écrit noir sur une “une bien plus grande partie”
Ce que vous réfutez, c’est vous qui l’avez inventé…
Merci pour la réponse OK pour les guillemets mais alors… ça ne s’intéresse qu’aux pages qui contiennent “www.example.com” non ?
Si oui, on voit logiquement ressortir tous les freeglobes et autres annuaires à “pages détaillées” mais on zappe tous les BL en provenance de sites qui ne présentent pas l’URL, non ?
En fait, c’est le deuxième exemple que j’ai donné à Olivier, cela sort les (pas toutes sans doute) pages qui présentent l’url dans le b>code source. Donc les ancres autres que les ancres d’annuaires.
Maintenant, il est clair qu’il faut affiner la méthode, en voyant comment on peut cerner au mieux l’url (je prendrais volontiers l’url sans le www pour avoir les deux versions, et sans doute exclure deux sites, avec et sans www).
En toute logique, cela doit aussi prendre les liens en noindex et nofollow, qui eux n’apparaissent pas dans GWT. Cela doit donc faire sortir pas mal de pages pour ceux qui blogguent beaucoup, pages de commentaires qui ne jouent pas pour les liens.
Je pense que si on veut réellement étudier un site, on peut estimer un certain nombre de choses avec des requêtes spécifiques (par exemple ressortir les pages qui ont aussi comment ou commentaires, etc…) et que cela reste un gros boulot, moins précis que GWT.
On retrouve néanmoins un moyen d’estimer un volume de liens plus proche de la réalité
Oui ce dernier exemple est mieux, il montre en effet qu’on peut trouver des liens qu’on n’aurait peut-être pas trouvés via Google ou Yahoo.
Cela dit ce n’est qu’une petite partie des liens, puisque ce sont des liens trouvés sur des pages qui emploient le même mot que celui du nom de domaine du site étudié (ici mezgarne).
Moi ce qui me gène dans cette méthode, c’est qu’il y a trop de risque de déchets, c’est-à-dire de pages qui sortent mais qui pourtant ne font pas de lien.
En conclusion, cette méthode peut servir mais il faut l’associer à un autre outil qui vérifie s’il y a bien un lien.
@Olivier sur cet exemple précis tu as raison (bon les deux sites sont en fait les mêmes, mais ça Google n’est pas censé suivre les redirections 301)
Le lien suivant te conviendra-t-il ? Mezgarne y apparait, mais pas la chaine mezgarne.com (sauf dans le code)
Tout à fait d’accord avec ta conclusion :)
“une syntaxe de recherche permettait une bien meilleure approche que la commande “link” ”
Sauf que sur 10 test que je viens de faire, s’est du grand n’importe quoi.
Un exemple parmi les 10 :
link/ta technique/réel
1320 / 476000 / 12060
Donc, je confirme que cette article est n’importe quoi.
Maintenant, si toi ou Olivier avait le temps de décortiquer 476000 résultat, tant mieux pour vous. Perso, j’ai pas ce temps donc, requête totalement inintéressante.
Cet
tearticle est peut être faux, simplement au lieux de balancer des chiffres, ça peut être intéressant de voir pourquoi.Que tu ne sois pas d’accord ou que tu me prouves que j’ai tort, très volontiers. Que tu le fasses avec cette “douceur” dans l’expression… non merci.
Néanmoins, j’ajoute très volontiers que cette technique marchera très difficilement avec les sites dont l’url est une collection de mots clés.
Pour mettre tout le monde d’accord, je propose ceci :
intext:”exemple.fr” -site:exemple.fr
ou d’utiliser les outils pour webmasters de Yahoo! ou Live Search.
La commande n’apporte rien si ce n’est de vous donner une idée de la popularité d’un site ou d’un blog.
Et strictement rien de plus…
PS : 884 pages pour Encre de lune ;-)
:) eh oui, les cordonniers sont les plus mal chaussés :)
Nous sommes bien d’accord, il y a de meilleures alternatives.
Propose nous cette alternatives car sur yahoo c’est facile de trouver le nombres de backlink profond mais sur google je ne trouve pas ?
Cher “référencement de site”, pour obtenir un backlink sur un blog en dofollow, vous devrez prendre un pseudo qui soit autre chose qu’une suite de mots clés, lesquels ne sont certainement pas ceux que vous avez reçus comme nom et prénom à votre naissance