A quoi rêvent les algorithmes - Nos vies à l’heure des big data

Note de lecture par GENELOT Dominique

Bachelard aurait aimé ce livre, lui qui nous a appris que les données ne sont pas données, mais construites. Heinz von Foerster y aurait trouvé une magistrale (et inquiétante) illustration de ses travaux sur la récursivité. Le livre de Dominique Cardon n’est pas un appel au refus de l’innovation technologique, mais un appel à la vigilance épistémique et citoyenne face aux risques majeurs que l’usage sans conscience des nouveaux algorithmes ferait courir à nos sociétés C’est aussi une invitation à penser continument l’évolution du lien récursif entre l’homme et la machine. L’intention du livre est annoncée dès la deuxième page : « Comme l’invention du microscope a ouvert une nouvelle fenêtre sur la nature, les capteurs numériques sont en train de jeter leur filet sur le monde pour le rendre mesurable en tout. …  Aussi est-il essentiel de comprendre, de discuter et de critiquer la manière dont les algorithmes impriment leurs marques sur nos existences, jusqu’à devenir indiscutables et même invisibles. L’objet de ce livre est de comprendre ce que la révolution des calculs apportée par les big data est en train de faire à nos sociétés. Il décrit le monde auquel rêvent les algorithmes, avant que nous nous réveillions – trop tard. » Dans son introduction, Dominique Cardon décrit brièvement les deux dynamiques qui s’avancent pour nous faire entrer dans cette nouvelle « société des calculs » :  -          D’une part l’accélération du processus de numérisation et le torrent de données qui se déverse aujourd’hui sur internet. Un seul chiffre : chaque jour 3,3 milliards de requêtes sont effectuées sur les 30 000 milliards de pages indexées par Google. -          D’autre part le développement des algorithmes, donnant aux ordinateurs des instructions mathématiques pour trier, traiter, agréger et représenter les informations. Le décor étant planté, D. Cardon nous invite à « ouvrir la boite noire » pour éclairer les enjeux sociaux, éthiques et politiques qui accompagnent le développement du calcul algorithmique. Il ne s’agit pas de se réfugier dans une pseudo-opposition entre les « humains » et la « machine », ni de réduire la logique calculatoire aux intérêts économiques de ceux qui la fabriquent, dit-il. Il situe l’enjeu bien au delà : « Le propos de ce livre est politique. La manière dont nous fabriquons les outils de calculs, dont ils produisent des significations, dont nous utilisons leurs résultats, trame les mondes sociaux dans lesquels nous sommes amenés à vivre, à penser et à juger. … Les calculateurs fabriquent notre réel, l’organisent et l’orientent. Ils produisent des conventions et des systèmes d’équivalence qui sélectionnent certains objets au détriment d’autres, imposent une hiérarchisation des valeurs qui en vient progressivement à dessiner les cadres cognitifs et culturels de nos sociétés. » L’ouvrage est organisé en quatre chapitres. Dans un premier chapitre, il déniaise le lecteur qui pourrait encore croire à l’objectivité des différentes mesures qui prétendent dénombrer, classer, caractériser et qualifier les données numériques. Il montre comment les algorithmes prélèvent sur le web des données différentes (clics, liens, likes, traces) pour les soumettre à des opérations répondant à différentes conventions statistiques et comment chaque acteur du web choisit sa manière d’organiser la visibilité des informations, en fonction des objectifs stratégiques qu’il poursuit. D. Cardon distingue quatre méthodes statistiques de mesure, correspondant à des objectifs différents : -          Le comptage du nombre de visites d’un site, qui caractérise son audience et sa popularité. -          La mesure des échanges entre internautes, par le biais du comptage des liens reçus d’un autre site : c’est la mesure de l’autorité du site. -          L’évaluation des internautes par eux-mêmes (le fameux like de Facebook, ou le nombre d’amis) : c’est la mesure de réputation. -          La quatrième méthode est celle qui enregistre les « traces » de ce que font les internautes : où sont-ils, que font-ils, qu’achètent-ils, que mangent-ils, avec qui échangent-ils, que lisent-ils, etc. Ce relevé des traces a pour but de construire des prédictions sur le comportement des internautes, pour les inciter à agir dans telle direction plutôt que dans telle autre. Cette quatrième méthode de « prédiction par les traces » se caractérise par l’usage d’une technique statistique particulière, l’apprentissage automatique (machine learning),  qui est en train de bouleverser la manière dont les calculs pénètrent nos sociétés. Cette méthode contient en germe un danger énorme sur lequel D. Cardon revient largement par la suite. Un intérêt de son livre est de nous donner à voir comment fonctionne ce nouveau type d’algorithme basé sur l’apprentissage statistique, et d’en donner de nombreux exemples : « L’algorithme apprend en comparant un profil à ceux d’autres internautes qui ont effectué la même action que lui. De façon probabiliste, il soupçonne qu’une personne pourrait faire telle ou telle chose qu’elle n’a pas encore faite, parce que celles qui lui ressemblent l’ont, elles, déjà faite. Le futur de l’internaute est prédit par le passé de ceux qui lui ressemblent.  … Par la pratique des cookies, ce traçage s’effectue largement à l’insu des internautes : « Il est spécieux de laisser penser que, lorsqu’un site demande le consentement de l’utilisateur pour son usage, l’utilisateur sait qu’il consent aussi à ce que le cookie espionne ses navigations sur d’autres sites. … La guerre du traçage vient tout juste de commencer. » Le deuxième chapitre, intitulé « la révolution dans les calculs », décrit avec beaucoup d’acuité les enjeux épistémiques et politiques qui se nichent derrière cette nouvelle conception des algorithmes. D. Cardon décrit d’abord la porte ouverte à « la manipulation du réel » : Les instruments statistiques servent désormais moins à représenter le réel qu’à agir sur lui. … Les statistiques, photographies extérieures de la société, sont progressivement entrées dans les subjectivités contemporaines en leur permettant de se comparer, avant de venir subrepticement calculer à leur insu le comportement des personnes. … Les vérités statistiques sont devenues instrumentales : ce n’est plus la valeur propre du chiffre qui importe, mais l’évolution de la valeur mesurée entre deux enregistrements. … La société adapte son comportement aux informations statistiques qui sont données sur elle. Cette modélisation mimétique fabriquée par l’apprentissage statistique, non seulement prive les individus et les sociétés d’une construction réflexive de leur autonomie et de leur liberté de pensée, mais gomme en eux la conscience même de l’acte de modéliser. Le mécanisme de cette régression épistémique est clairement exprimé dans le passage suivant : « Puisque les ressources informatiques le permettent désormais, il n’est plus nécessaire d’affiner les modèles pour assécher la corrélation entre les variables qui lui servent d’hypothèses. Il suffit de demander à la machine de tester les corrélations possibles entre un nombre toujours plus grand de variables. Le modèle n’est plus une entrée dans le calcul, mais une sortie. » La question centrale devient alors : qui élabore les modèles des algorithmes qui produisent ces modèles en kits prêts à consommer, et quelles sont les intentions ou les conditionnements qui les animent ? C’est bien l’objet du livre : à quoi rêvent les algorithmes ? Si, comme l’écrit Dominique Cardon, les calculs sont destinés à guider nos conduites vers les objets les plus probables, alors voilà nos sociétés condamnées à reproduire leurs erreurs passées, et dans l’incapacité de penser leur futur ! Le troisième chapitre approfondit la façon dont fonctionnent les algorithmes, affine la question précédente et également les réponses que l’on peut y donner. Il apporte un très intéressant éclairage sur le fonctionnement de ces « machines statistiques » et sur la nouvelle intelligence artificielle (IA). Cet apport prend un relief tout particulier quand on sait que ce livre a paru quelques mois avant que l’algorithme Alphago ne batte au jeu de Go Lee Sedol, l’un des meilleurs joueurs mondiaux[1]. D. Cardon explique que désormais, les machines cherchent beaucoup moins à modéliser le raisonnement qu’à ingurgiter des contextes à travers d’énormes masses de données. Les concepteurs ont abandonné l’ambition de faire des machines « intelligentes ». Ils préfèrent les rendre « statistiques ». Sur la question des intentions des fabricants d’algorithmes, il apporte des clarifications techniques et balise le champ du légitime questionnement que la société doit leur opposer :   « Il est vain de réclamer que soit levé le secret des algorithmes et plus utile de connaître les flux de données qui entrent dans la composition du calcul. … Ceux qui fabriquent les calculs leur donnent un objectif. S’il n’est guère possible d’enquêter dans les variables versatiles des algorithmes, il est en revanche décisif de demander à ceux qui les fabriquent de rendre publics les objectifs qu’ils leur donnent. … En alignant leurs calculs personnalisés sur les comportements des internautes, les plateformes ajustent leurs intérêts économiques à la satisfaction de l’utilisateur. Sans doute est-ce à travers cette manière d’entériner l’ordre social en reconduisant les individus vers leurs comportements passés que le calcul algorithmique exerce sa domination. Il prétend leur donner les moyens de se gouverner eux-mêmes ; mais, réduits à leur seule conduite, les individus sont assignés à la reproduction automatique de la société et d’eux-mêmes. Le probable préempte le possible. … C’est le comportementalisme radical des nouvelles techniques de calcul qu’il faut questionner. Avec une insistance provocante, les concepteurs des algorithmes prédictifs ne cessent de dire qu’ils ne font que s’appuyer sur les comportements passés de l’internaute pour lui recommander des choses à faire. L’utilisateur est ainsi constamment renvoyé à sa seule responsabilité et à ses ressources sociales et culturelles. La logique algorithmique colle à ce que font les individus en considérant, de façon très conservatrice, qu’ils sont rarement à la hauteur de leurs désirs. En préférant les conduites aux aspirations, les algorithmes nous imposent ce réalisme efficace. Ils nous emprisonnent dans notre conformisme. » D. Cardon propose alors une manière indirecte d’exercer notre vigilance citoyenne : « Si la neutralité des algorithmes est impossible à vérifier, il est en revanche important de demander aux plateformes du web de respecter leurs utilisateurs en faisant réellement faire à leurs calculateurs ce qu’elles disent et prétendent leur faire faire. Dans de récents rapports, le Conseil national du numérique et le Conseil d’État ont fait apparaître la revendication nouvelle d’une « obligation de loyauté » des plateformes envers leurs utilisateurs. » Le dernier chapitre propose une lecture plus politique du type de société qui rend aujourd’hui possible le déploiement des algorithmes. Il est clair que de nouvelles formes d’exercice de la démocratie sont apparues avec le web :[2] « Les algorithmes ont entrepris de calculer la société par le bas, depuis le comportement des internautes. … Les techniques de calcul mises en œuvre pour réorganiser la société depuis les individus ont pris des formes multiples : les clics des internautes fabriquent de la popularité, les citations hypertextuelles de l’autorité, les échanges entre cercles affinitaires de la réputation, les traces des comportements une prédiction personnalisée et efficace. … En redéployant les identités et les manières de les associer, le web a permis la fabrication d’un ensemble inattendu de formes d’actions collectives : pétitions en ligne, mouvement de solidarisation pour une cause autour d’une page Facebook, déclenchement « spontané » de mouvements sociaux, financement coopératif de projets (crowdfunding), etc. Les univers que s’ouvrent ainsi les individus se caractérisent par le fait qu’ils ne préjugent pas a priori des identités des participants. … La recomposition de la société à partir des investissements expressifs des individus constitue sans doute la part la plus positive des nouvelles formes de vie numérique. » Mais cette face démocratique des algorithmes ne doit pas masquer une autre face, que D. Cardon décrit sous le terme de « sécession des excellents » : « La fluidification et la globalisation du marché des jugements numériques engendrent des effets statistiques qui confèrent aux gagnants des avantages cumulés considérables. … Les traditionnelles distributions des inégalités selon la loi de Pareto, qui donne à 20 % d’une population 80 % du bien à répartir, ont pris sur le web la forme d’une loi de puissance beaucoup plus accusée, qui réserve souvent à moins de 1% des acteurs plus de 90 % de visibilité. … En fait, les calculateurs donnent à la société les moyens de reproduire d’elle-même les inégalités et les hiérarchies qui l’habitent. ». Dominique Cardon termine son propos sur une note optimiste, sous condition de vigilance : Il rappelle l’enjeu : « L’enjeu politique que posent les nouvelles boites noires du calcul algorithmique est celui de la capacité à les débrayer et à passer en manuel. Le risque que présentent les nouvelles infrastructures de calcul est d’architecturer les choix en les fermant sur des processus irréversibles. … Face à ces grands systèmes techniques qui capturent nos habiletés, il est de plus en plus nécessaire d’apprendre à ne pas désapprendre. » Mais il note que les internautes ne se plient pas aux desiderata des algorithmes aussi facilement que l’imagent les concepteurs d’algorithmes : « Lorsque les usages sont observés depuis la réalité quotidienne des internautes, l’emprise des calculateurs sur leur vie semble s’évaporer. Les usages sont beaucoup plus vagabonds, diversifiés et stratèges que ne le pensent ceux  qui raisonnent depuis une seule plate-forme. … La réduction de leurs pratiques à des  automatismes comportementaux fait oublier que les usages d’Internet ne cessent de se complexifier, de  s’intellectualiser et de devenir en eux-mêmes des objets réflexifs. Comme pour toutes les autres technologies intellectuelles, il n’y a pas de raison de penser que les utilisateurs ne parviennent pas à socialiser les calculateurs, à déployer des stratégies pour les domestiquer et à leur opposer des contre-calculs. … Il est encore temps de dire aux algorithmes que nous ne sommes pas la somme imprécise et incomplète de nos comportements. » Voilà un livre à lire, pour éveiller notre vigilance, et à relire pour la nourrir ! Dominique Genelot, juin 2016

[1] Match en cinq parties, mars 2016 : Lee Seebol gagna la 4° partie [2]  Le précédent ouvrage de Dominique Cardon, « La démocratie internet », Seuil, 2011, explorait déjà cette question.