Surcharge d’information

2 octobre 2007

Au secours!

Mes champs d’intérêt sont trop variés! Il y a trop de textes et de sites Web captivants!

Je suis abonné, au moment où j’écris ces lignes, à 479 flux RSS ou Atom dans Google Reader et je ne cesse d’en ajouter, ce qui me demande de gérer environ un millier de nouveaux billets quotidiennement. Aussi, j’ai à trier les courriels de dizaines de listes de diffusion et infolettres auxquelles je suis inscrit. Et je ne compte plus mes très nombreux signets à lire dans del.icio.us. De plus, j’ai régulièrement 10, 20 ou 30 onglets ouverts en même temps dans Firefox.

Bon, je suis peut-être un cas isolé, mais la réalité est quand même que la quantité d’information disponible au commun des mortels, sur tous les domaines, est en explosion sur le Web. Aussi, et surtout, les moyens d’accéder et de consulter ces informations se multiplient. En plus de ceux que j’ai nommé plus haut, on peut, par exemple, penser à Google Alerts: ce service permet d’être informé par courriel de tout changement dans les résultats de recherche, les nouvelles, les vidéos et les groupes de discussion de Google, en fonction d’une simple sélection de mots clés. Vous imaginez facilement la quantité de courriels qui pourrait submerger votre boîte de réception!

Donc, on peut se retrouver aisément devant une situation, comme la mienne, où l’information nous est acheminée à une bien plus grande vitesse que ce qu’on est humainement capable de consommer.

Alors, comment peut-on gérer une si grande affluence d’information pertinente? Que faire quand on veut tout savoir sur un sujet donné ou même, parfois, quand on veut seulement se tenir à jour dans un domaine très actif? C’est bien pire quand on a, comme moi, des intérêts variés!

Je n’ai malheureusement pas de réponse.

Certes, comme nous en fait part Scoble, il existe des agrégateurs, tel que Techmeme, qui fouillent le Web de façon automatique et qui recensent les nouveaux articles sur un sujet donné en évitant les redondances et en écartant les informations de moindre importance. Cependant, ces outils sont efficaces pour des sujets fixés à l’avance et plutôt vastes et explorent des sites Web définis. Ainsi, il n’existe toujours pas d’outil capable d’analyser le Web dans son ensemble et de générer une synthèse de l’actualité d’une sélection pointue et personnalisée de sujets.

Par conséquent, la sémantisation du Web aidera certainement à faciliter l’absorption de l’information. En effet, en structurant clairement et précisément un contenu, de façon standard, les machines seraient plus facilement capables d’extraire le sens de ce contenu et ainsi de traiter et classer l’information pour mieux nous la présenter. Déjà, il y a une prolifération d’outils qui croisent et mettent à profit les données, lesquelles sont disponibles en quantité sur le Web, afin de leur ajouter de la valeur. Ils ne restent qu’à appliquer ce principe au contenu textuel.

Le problème est que cette sémantisation implique une certaine qualité de rédaction et surtout de codage qui est relativement difficile à atteindre de par la diversité quasi infini des créateurs de contenu et, plus simplement, de par le caractère humain de ces auteurs. Les imperfections, qui seront toujours présentes, ne rendent pas la lecture et la compréhension impossibles, mais certainement plus ardue, surtout pour des machines. Il n’empêche qu’à terme des programmes pourront plus facilement décoder la grande quantité d’information, nous la prémâcher et nous la livrer d’une manière plus concise, ce qui nous demandera passablement moins d’efforts qu’aujourd’hui.

Pour en arriver là, une plus grande prise de conscience de l’importance du Web sémantique sera nécessaire de la part des créateurs de contenu. Il reste donc beaucoup de chemin à parcourir. Pourtant, nous ne sommes plus si loin de cette réalité.

D’ici là, il me reste deux solutions: m’armer de courage devant la tonne d’information ou, plus raisonnablement, tolérer une certaine dose d’ignorance.

8 Réponses à “Surcharge d’information”

  1. Manuel Vila Dit:

    Je ne crois pas aux filtres automatiques permettant de dénicher les informations pertinentes. Je ne crois pas non plus que le web sémantique améliorera les choses en ce qui concerne la “surcharge d’information”. C’est d’avantage du côté des outils qu’il faut chercher des solutions, une nouvelle génération de réseaux sociaux devrait changer profondément la donne en agrégeant et rationalisant une grosse partie des contenus jusqu’ici éparpillés :

    http://blog.kindalab.com/2007/09/29/how-to-revolutionize-social-networks/

  2. Simon Bédard Dit:

    À mon avis, l’un ne va pas à l’encontre de l’autre, au contraire.

    Le développement et l’ouverture des réseaux sociaux faciliteront certainement le partage et la circulation de l’information. Cependant, le passage lui-même de l’information dans ces réseaux constitue un filtre qui favorise un certain type de contenu plus “populaire” au détriment du contenu plus “ciblé”. On le voit bien avec Digg, par exemple.

    Une veille en profondeur nécessite donc autre chose.

  3. Isabelle Dit:

    Merci d’avoir mis en mots une détresse que je vis également…

  4. Hugo Dit:

    Hum… La dernière solution que tu évoques, Simon, me semble non seulement la plus praticable, mais aussi (surtout) la plus saine. C’est comme n’importe quoi : plus on creuse large, moins on creuse profond. Pour réussir à faire une veille sérieuse, il faut soit la faire à temps plein (et idéalement être payé pour), soit en restreindre l’étendue — peut-être même les deux. En plus, c’est meilleur pour la santé. :)
    Ceci dit, je ne crois pas, moi non plus, que les agrégateurs automatiques soient la solution. Leur fonctionnement est typiquement fondé sur la récurrence (c’est-à-dire la popularité, le “zeitgeist”), ce qui n’est pas nécessairement gage de pertinence.

    Et que penser du web sémantique? Je n’ai pas un avis très informé sur la question, mais pour ce que j’en sais, le web n’a pas encore atteint le niveau de maturité approprié. Même si l’on se restreint aux producteurs de contenu spécialisés (magazines et blogues professionnels, sites de groupes d’intérêt et de centres de recherche, etc.), c’est à peine si l’on fait usage de microformats… alors le contenu sémantiquement explicite, c’est pas demain la veille. Et rares sont encore les entreprises qui, à l’interne, se donnent les moyens d’une “réingénierie” de leurs contenus.

    Pour en revenir à ta pléthore de flux RSS, je ne peux que te souhaiter un bon élagage…

  5. Manuel Vila Dit:

    Simon, en effet, les réseaux sociaux ne vont pas tout solutionner comme par magie, la décentralisation extrème n’est pas mieux que la centralisation à outrance, on aura toujours besoin de filtres mais ceux-ci peuvent être humains. Comme tu l’as dit, la popularité est rarement liées à la qualité, il faut donc des personnes capables de faire le tri. Mais ces personnes existent, ce sont les journalistes, les blogueurs, les éditeurs, les labels et même les marchands (dans le bon sens du terme), autant de personnes qui auront leur place au sein des réseaux sociaux. Certes, on recevra la lifestream de nos amis, des membres de notre famille, des collègues de travail, etc. Mais on aura également des personnes plus ou moins influentes (qui ne nous connaissent même pas) dans nos contacts, qu’ils s’agissent d’experts spécialisés dans des domaines très précis, de journalistes, de blogueurs, de politiques, on sera malgré tout connecté à des “filtres humains”.

  6. Simon Bédard Dit:

    @Hugo: Ne t’en fais pas, je ne me tape pas 1000 billets par jour. La veille implique également le développement et l’utilisation de techniques de lecture et de manipulations intellectuelles qui diminuent grandement l’effort à accomplir. Mais, pour reprendre ton image, plus on veut creuser profondément, plus il est préférable de faire un gros trou. ;-)

    @Manuel: Je suis d’accord avec toi, les réseaux sociaux seront des sources considérables d’information. Je ne suis pas certain, par contre, qu’ils seront suffisant en eux-mêmes. Ces journalistes, blogueurs et autres fournisseurs de contenu, où dénicheront-ils leurs informations spécialisées?

    Je prétends que, de plus en plus, les outils “mécaniques” pourront nous assister dans la recherche d’information. Cependant, eux non plus de seront jamais suffisants en eux-mêmes. Ce qu’on appelle “intelligence” artificielle se développe, mais, à mon avis, ne remplacera jamais la véritable intelligence qui consiste à être capable de jugement, mélange d’émotions et de raison, qui dépasse tout calcul mathématique.

  7. Manuel Vila Dit:

    Simon, les journalistes dénicheront l’info également via les réseaux sociaux, en guise de contacts ils auront les agences de presse (AFP, Reuteurs,…) bien sûr mais aussi une liste impressionnante de personnes dont ils suivront directement la lifestream, comprenant les politiques, les philosophes, les artistes, le pape, les ONG, l’ONU, etc.

  8. Richard Picard Dit:

    Bonjour Simon,

    Ton cas de surinformation est bien typique de notre nouvelle ère d’abondance. Comme plusieurs d’entre nous, on croit souvent à tort que la quantité d’information constitue un gage de qualité. C’est rarement le cas.

    D’ailleurs et c’est fascinant dans un sens, cela me ramène au nouveau concept écononique de la “Longue Traîne”. où même le nombre limité de ventes en ligne justifie le classement d’information pratiquement infinie.

    Mais je ne pense pas que le nombre de tes neurones soient infinies ! ;-)
    D’où l’importance des choix par filtres ou simplement par sélection naturel d’intérêt. Pour ma part c’est ce que je fais, lorsque je lis un article je lui accorde une cote de 1 à 10 et je fais une moyenne par mois. Si le site ne passe pas les 60% au bout de 3 mois je l’enlève de ma liste. Par ailleurs, je lis beaucoup de résumés. À ce propos je te suggère Copernic qui résume assez bien les longs textes (pourquoi pas encouragé les gens de chez nous). Voici le lien :
    http://www.copernic.com/en/products/summarizer/download.html

Répondre