Dans mes lectures de la journée, deux posts qui se font écho d’une manière tout à fait intéressante.
D’un côté, Tristan Nitot dans son standblog signale:
Fascinant : un milliard de pages Web analysées par Google et l’ami Hixie (dixit Slashdot) ;
Mais je venais de lire, ce billet par John Walkenbach, dans J-Walk Blog:
In terms of sheer number of links returned, MSN Search is the surprising winner. For the experimental URL, I don’t think it found all of them, but it did better than any other single search site. Based on this little experiment, my opinion of MSN Search went up a notch or two.
Voilà comment a procédé John Walkenbach pour tester la capacité des moteurs de recherche a identifier les liens vers une url.
Il a fait un billet, demandé à d’autres bloggers de le référencer et fait une analyse des résultats de différents moteurs de recherche (Google, MSN Search, Technorati, BlogLines, IceRocket, …). Ce qui est incroyable, c’est que ce n’est ni Technorati, ni Google qui sortent gagnants de cet ingénieux test mais MSN Search. MSN Search ayant changé sa méthode d’indexation en 2005, voir ici et là.
Etant pro Jobs comme on est pro Jospin, ou anti Gates comme on est anti Bush si vous préférez, cela ne me fait vraiment pas plaisir de voir une technologie Microsoft à ce point efficace. Je l’ai testée sur mon blog et il n’y a pas de doute pour moi: j’ai trouvé des liens que je ne trouve pas ailleurs, même si je connais des liens qui ne sont pas présents. Dernier point, je suis assez déçu par Technorati, qui fait un assez mauvais boulot dans ce domaine. Si j’ai bien compris, ils fondent pourtant leur ranking sur ces liens! Si quelqu’un veut confirmer dans un commentaire érudit!
J’en ai profité chercher les statistiques d’indexation de Google:
Google en quelques chiffres:
Nombre de pages explorées : plus de 8 milliards
Images : plus de 1 milliard
Messages Usenet : plus de 1 milliard
Ce qui me fait mieux comprendre le lien de StandBlog dans son post: Google a fait une analyse statistique du contenu HTML d’un milliard de pages. Mais ils ont indexés plus de 8 milliards de pages.
Cette étude statistique au travers de Google a-t-elle un réel intérêt?
La curiosité de chacun à vouloir savoir comment le monde est fait dans ses moindres détails est légitime. Mais la méthode utilisée ici me fait surtout penser au “brute force cracking”, un marteau pour écraser une mouche. Une étude statistique n’a pas besoin d’être aussi exhaustive pour être valable. Sans compter, que les conclusions douteuses d’une telle étude c’est beaucoup d’interrogations, très peu de réponses et un formidable buzz. Lisez à ce sujet ce commentaire de Ergowa sur la news de Slashdot. Tout comme cet internaute courageux de développer de telles idées directement sur SlashDot, je trouve cette étude moraliste et discutable. Ce dernier point étant à mes yeux sont premier atout.
Finallement, cette étude n’est-elle qu’un axe de communication très habile de Google vers les adeptes des standards? Vers les habituels méfiants des sociétés hyper-capitalistiques et multi-nationales, les fameux adeptes du logiciel libre, les anti-brevets, la masse des promoteurs inconditionnels de la Mozilla Foundation et d’OpenOffice? La frontière est très mince entre la rébellion et la compromission et il semble que personne ne puisse donner de leçon même pas ceux qui sont les plus radicaux. Que pensez du Google Big Brother? Avec moins de publicité, Google censurerait-il les résultats de son moteur pour conquérir un marché prometteur?
Filtering our search results clearly compromises our mission. a admit Google, ajoutant Failing to offer Google search at all to a fifth of the world’s population, however, does so far more severely.. C’est vraiment être naif de penser que Google a pris cette décision face à ces réalités. Elle a pris cette décision parce qu’il y a 1 milliard de clients, un marché formidable et que les droits de l’homme ne pèsent rien face à cela, pour cette société respectable et respectée.
Google doit faire attention à son image et a forcement des actions dans ce sens. Cette étude en fait-elle partie? Je ne le sais pas. Microsoft ne serait pas un si mauvais élève que les bien-pensants de l’informatique veulent le croire en regard du comportement de Google. Ou aurement dit, les deux sociétés se valent très certainement dans ce domaine!
Surtout, j’en conclu à la lecture des deux billets, que Google n’est peut-être pas à l’abri de la concurrence sur le marché des moteurs d’indexation. Comme Netscape a disparu du marché des navigateurs, Google pourrait perdre sa première place à oublier que son coeur de métier est l’indexation de contenu. Google pourra de toute façon se ratrapper sur son métier de publicitaire, très lucratif et, d’après ce que j’en ai lu, plus performant que la concurrence.
Je vais tester MSN Search dans les semaines qui viennent et si les résultats sont concluants, je deviendrai ce que les anglais appellent un “switcher”.
UPDATE 1er février 2006:
Cela fait plaisir d’avoir raison de temps en temps… Voici un lien vers un article de CNN Money et un autre sur Yahoo Finance:
Some analysts have added that Google will soon face more significant competitive pressure from Yahoo! as well as Microsoft (Research). Microsoft’s MSN Internet unit is set to launch a new online search tool for advertisers soon called adCenter this year. adCenter will allow advertisers to bid for keyword searches based on specific customer data such as age, gender and geographic location.

Comments
Leave a comment Trackback