Sauvez Google ! Arrêtez de bloguer...

16 novembre 2009 1 16 /11 /novembre /2009 07:00

Le Web a-t-il passé son pic ?

On avait déjà suggéré que bon nombre d'acteurs du Web 2.0 nous paraissaient bien trop fragiles pour être pérennes, même si pour survivre ils n'hésitent pas à se transformer en Big Brothers. Une autre menace couve : la submersion du signal par le bruit.

Si Google a émergé et s'est imposé au début des années 2000, c'est pour deux raisons : sa capacité à scruter rapidement l'ensemble du Web - ce qui n'a rien d'évident en soi, et qu'on ne souligne pas assez - et son fameux algorithme PageRank qui lui permet de calculer automatiquement la pertinence d'une page. Ces deux savoir-faire conjugués lui ont permis de battre à plates coutures les moteurs de recherche d'alors.

Mais le Web n'est plus ce qu'il était : les quelques millions de pages perso du Web 1.0 ont été complétés par des centaines de millions de blogs et maintenant par des milliards de tweets. Or le Web, contrairement aux autres médias, ne dispose pas d'une fonction de décantation : tout ce qui est publié reste disponible et accessible. Certes, on pourrait dire qu'il suffit alors que PageRank intègre la date de création ou de mise à jour de la page - et c'est ce qu'il fait. Le seul problème, c'est que cela revient à donner raison au dernier à prendre la parole sur un sujet donné, même s'il raconte n'importe quoi.

Prenons un exemple, l'article premier de la Déclaration des Droits de l'Homme : "Les hommes naissent et demeurent libres et égaux en droits". Tapez cette phrase dans Google et regardez les sites qui en sort. A l'heure où nous écrivons ces lignes, les 5 premiers liens qui en résultent ne sont pas de source officielle : vient d'abord wikisource.org, puis oboulo.com, wikipédia, parisbanlieue.blog.lemonde.fr, comlive.net et, enfin, le site de l'Assemblée Nationale. Puis encore des blogs. Heureusement que sur ces mots-clés, il n'y a pas (encore) de liens sponsorisés...

Ce qui arrive au Web s'illustre assez facilement : imaginez une bibliothèque municipale qui, non seulement ne ferait pas le ménage régulier dans les magazines qu'elle met à disposition du public, mais en plus permettrait à chacun de mettre en rayon son journal intime, ses cours d'école, son courrier, la transcription de ses conversations avec ses amis... Même avec une armée de bibliothécaires, on finit par perdre pied. La puissance informatique de Google permet d'aller très loin, mais il y a quand même une limite, et on se demande si on ne commence pas à s'en approcher.

Il n'est donc pas impossible que, d'ici quelques années, le nombre de pages Web sans intérêt soit devenu si grand que Google ne soit plus d'un grand secours pour faire des recherches, sérieuses ou pas. Jusqu'à ce qu'un nouveau moteur de recherche, capable de distinguer le signal du bruit et non simplement le bruit le plus fort, émerge et fasse trembler le piédestal de Google.

Partager cet article

Repost0

Published by Aerobar Films - dans Ruptures
commenter cet article …

commentaires

E2100

19/11/2009 19:59

Très bel exemple pour illustrer l'Enfouissement Sémantique. Je pense qu'il reste à Google, qui est resté prudemment cantonné dans le domaine mathématique (je cite : Le PageRank est alors simplement la probabilité stationnaire d'une chaîne de Markov, c'est-à-dire un vecteur de Perron-Frobenius de la matrice d'adjacence du graphe du Web), à définir une véritable estimation du rapport S/B d'une page.

Répondre

Aerobar Films

23/11/2009 14:57

On tombe là sans doute sur une des pierres d'achoppement de l'IA et notamment de la traduction automatique : tant qu'une machine n'arrivera pas, même imparfaitement, à capter le sens d'un texte, il lui sera difficile a fortiori d'en mesurer l'intensité et donc de lui attribuer une note de "signal". Il y a pourtant un vrai enjeu émergent pour les puissances occidentales : mettre au point une telle machine permettrait de rééquilibrer le rapport de forces avec l'Asie. Aujourd'hui, l'Orient sait lire la partie occidentale du Web, mais le contraire n'est pas vrai.

Glopf

18/11/2009 13:58

"C'est peut-être parce qu'elle était devenue inindexable qu'on a fait brûler la bibliothèque d'Alexandrie ?" Ou tout simplement parce que tant d'érudition et de savoir concentrés en un lieu gênaient les puissants dans leur domination des peuples par la force de l'ignorance...

Répondre

Aerobar Films

18/11/2009 22:55

Oh, on doute que l'entrée était libre, de toute façon... On était assez loin du concept de la bibliothèque municipale, à l'époque.

vincent128

16/11/2009 12:18

On constate un phénomène similaire concernant les vidéos. Quand on recherche des vidéos sur un des principaux sites de diffusion de vidéo, sur un sujet a priori sérieux, on tombe sur des vidéos bidons, le plus souvent réalisées par des adolescents américains, et dont le seul objectif semble être, grâce à un choix de mots-clés judicieusement choisis, que cette vidéo sans intérêt soit vue par le plus de monde possible.

Répondre

Aerobar Films

16/11/2009 21:08

C'est le problème de la forteresse et la canonnière, transposée à l'époque moderne !

Glopf

16/11/2009 12:04

Brillant article qui pose la question cruciale de l'archivage du web. Quels sites, quels blogs, quelles images jpg laisserons-nous à nos enfants et aux futurs historiens? Un pan entier de la culture du XXIeme risque de disparaître dans la masse des octets à moins que nous trouvions les moyens nécessaires à l'édification d'une cyber-bibliothèque d'Alexandrie.

Répondre

Aerobar Films

16/11/2009 21:07

C'est peut-être parce qu'elle était devenue inindexable qu'on a fait brûler la bibliothèque d'Alexandrie ? Voilà une belle théorie du complot express que ne dénigrerait pas un Dan Brown...

Patrik

16/11/2009 08:35

D'accord, du moins, tant que Google, entre autres, ne modifiera pas son moteur de recherche. On peut espérer néanmoins que même eux sont conscients de ce risque de couverture du signal par le bruit, non ?

Répondre

Aerobar Films

16/11/2009 21:06

Tout dépend des efforts de R&D évolutive que Google avait prévu sur son moteur initial... et que ces efforts aient finalement été fructueux ! Il y a plein de choses qu'on cherche sans trouver - la fusion nucléaire industrielle, par exemple.

Sauvez Google ! Arrêtez de bloguer...

commentaires

Présentation

Recherche

Recherche

Articles Récents

Pages

Liens