16 novembre 2009
1
16
/11
/novembre
/2009
07:00
Le Web a-t-il passé son pic ?
On avait déjà suggéré que bon nombre d'acteurs du Web 2.0 nous paraissaient bien trop fragiles pour être pérennes, même si pour survivre ils n'hésitent pas à se transformer en Big Brothers. Une autre menace couve : la submersion du signal par le bruit.
Si Google a émergé et s'est imposé au début des années 2000, c'est pour deux raisons : sa capacité à scruter rapidement l'ensemble du Web - ce qui n'a rien d'évident en soi, et qu'on ne souligne pas assez - et son fameux algorithme PageRank qui lui permet de calculer automatiquement la pertinence d'une page. Ces deux savoir-faire conjugués lui ont permis de battre à plates coutures les moteurs de recherche d'alors.
Mais le Web n'est plus ce qu'il était : les quelques millions de pages perso du Web 1.0 ont été complétés par des centaines de millions de blogs et maintenant par des milliards de tweets. Or le Web, contrairement aux autres médias, ne dispose pas d'une fonction de décantation : tout ce qui est publié reste disponible et accessible. Certes, on pourrait dire qu'il suffit alors que PageRank intègre la date de création ou de mise à jour de la page - et c'est ce qu'il fait. Le seul problème, c'est que cela revient à donner raison au dernier à prendre la parole sur un sujet donné, même s'il raconte n'importe quoi.
Prenons un exemple, l'article premier de la Déclaration des Droits de l'Homme : "Les hommes naissent et demeurent libres et égaux en droits". Tapez cette phrase dans Google et regardez les sites qui en sort. A l'heure où nous écrivons ces lignes, les 5 premiers liens qui en résultent ne sont pas de source officielle : vient d'abord wikisource.org, puis oboulo.com, wikipédia, parisbanlieue.blog.lemonde.fr, comlive.net et, enfin, le site de l'Assemblée Nationale. Puis encore des blogs. Heureusement que sur ces mots-clés, il n'y a pas (encore) de liens sponsorisés...
Ce qui arrive au Web s'illustre assez facilement : imaginez une bibliothèque municipale qui, non seulement ne ferait pas le ménage régulier dans les magazines qu'elle met à disposition du public, mais en plus permettrait à chacun de mettre en rayon son journal intime, ses cours d'école, son courrier, la transcription de ses conversations avec ses amis... Même avec une armée de bibliothécaires, on finit par perdre pied. La puissance informatique de Google permet d'aller très loin, mais il y a quand même une limite, et on se demande si on ne commence pas à s'en approcher.
Il n'est donc pas impossible que, d'ici quelques années, le nombre de pages Web sans intérêt soit devenu si grand que Google ne soit plus d'un grand secours pour faire des recherches, sérieuses ou pas. Jusqu'à ce qu'un nouveau moteur de recherche, capable de distinguer le signal du bruit et non simplement le bruit le plus fort, émerge et fasse trembler le piédestal de Google.
On avait déjà suggéré que bon nombre d'acteurs du Web 2.0 nous paraissaient bien trop fragiles pour être pérennes, même si pour survivre ils n'hésitent pas à se transformer en Big Brothers. Une autre menace couve : la submersion du signal par le bruit.
Si Google a émergé et s'est imposé au début des années 2000, c'est pour deux raisons : sa capacité à scruter rapidement l'ensemble du Web - ce qui n'a rien d'évident en soi, et qu'on ne souligne pas assez - et son fameux algorithme PageRank qui lui permet de calculer automatiquement la pertinence d'une page. Ces deux savoir-faire conjugués lui ont permis de battre à plates coutures les moteurs de recherche d'alors.
Mais le Web n'est plus ce qu'il était : les quelques millions de pages perso du Web 1.0 ont été complétés par des centaines de millions de blogs et maintenant par des milliards de tweets. Or le Web, contrairement aux autres médias, ne dispose pas d'une fonction de décantation : tout ce qui est publié reste disponible et accessible. Certes, on pourrait dire qu'il suffit alors que PageRank intègre la date de création ou de mise à jour de la page - et c'est ce qu'il fait. Le seul problème, c'est que cela revient à donner raison au dernier à prendre la parole sur un sujet donné, même s'il raconte n'importe quoi.
Prenons un exemple, l'article premier de la Déclaration des Droits de l'Homme : "Les hommes naissent et demeurent libres et égaux en droits". Tapez cette phrase dans Google et regardez les sites qui en sort. A l'heure où nous écrivons ces lignes, les 5 premiers liens qui en résultent ne sont pas de source officielle : vient d'abord wikisource.org, puis oboulo.com, wikipédia, parisbanlieue.blog.lemonde.fr, comlive.net et, enfin, le site de l'Assemblée Nationale. Puis encore des blogs. Heureusement que sur ces mots-clés, il n'y a pas (encore) de liens sponsorisés...
Ce qui arrive au Web s'illustre assez facilement : imaginez une bibliothèque municipale qui, non seulement ne ferait pas le ménage régulier dans les magazines qu'elle met à disposition du public, mais en plus permettrait à chacun de mettre en rayon son journal intime, ses cours d'école, son courrier, la transcription de ses conversations avec ses amis... Même avec une armée de bibliothécaires, on finit par perdre pied. La puissance informatique de Google permet d'aller très loin, mais il y a quand même une limite, et on se demande si on ne commence pas à s'en approcher.
Il n'est donc pas impossible que, d'ici quelques années, le nombre de pages Web sans intérêt soit devenu si grand que Google ne soit plus d'un grand secours pour faire des recherches, sérieuses ou pas. Jusqu'à ce qu'un nouveau moteur de recherche, capable de distinguer le signal du bruit et non simplement le bruit le plus fort, émerge et fasse trembler le piédestal de Google.