TRIBUNE LIBRE : Intelligence Artificielle, l’oxymoron du siècle

Temps de lecture : 8 minutes >

[FUTURIMMEDIAT.NET, 11 janvier 2023] Puisque tout le monde en parle, il doit certainement se passer quelque chose. Pas une journée ne s’écoule sans que sorte un nouvel article, dithyrambique ou alarmiste, dans le domaine très en vogue de l’Intelligence Artificielle. Depuis le Guardian jusqu’à Trust My Science, on nous apprend comment l’IA, en ce moment même, est en train de nous propulser dans une nouvelle ère – ou de nous condamner à l’apocalypse numérique. Sommes-nous à l’aube d’une réelle transition technologique, qui nous apporterait enfin des logiciels d’image pourvus d’imagination, des véhicules autonomes fiables, et des assistants rédacteurs capables de résumer plusieurs textes et d’en faire la synthèse ? Ou bien sommes-nous désormais proches de la “singularité”, plus menacés que jamais par un futur dystopique, du genre Matrix ou Terminator, où les machines auront atteint leur autonomie et prendront le contrôle de l’humanité ?

Ni l’un ni l’autre : les progrès récents, bien que réels et importants pour l’Intelligence Artificielle elle-même, n’auront probablement qu’un impact négligeable sur l’industrie et sur notre quotidien. Le seul vrai problème avec Chat GPT, l’outil de génération de texte que les commentateurs montrent du doigt, c’est la profusion des articles alarmistes – et très mal documentés – qui nous mettent en garde contre cette prétendue menace.

Quant aux synthétiseurs d’images par diffusion (Dall-e, Stable Diffusion, Midjourney, etc.) ils n’ont pas pour objectif de révolutionner les métiers graphiques, et n’en ont pas les moyens, quoiqu’en disent les millions de geeks désœuvrés qui passent leurs nuits à générer des images sans queue ni tête. Tempête dans un verre d’eau, à moitié vide ou à moitié plein, selon l’humeur de l’auteur. Beaucoup de bruit pour des clopinettes. Jouer avec les IA est certes merveilleux : c’est fascinant de les voir écrire, dialoguer, dessiner, cracher des photographies stupéfiantes et élaborer des créations graphiques à couper le souffle. Mais, malheureusement, ces jouets extraordinaires ne pourront pas nous servir à grand’chose de plus qu’à jouer.

Quand l’artifice nous trompe énormément

Au premier contact, les nouvelles intelligences artificielles sont brillantes. On a vu fleurir un peu partout sur le web des images inédites et spectaculaires dans tous les styles graphiques et photographiques, des paysages somptueux, des portraits séduisants, des pastiches délirants, et même des œuvres nouvelles de grands peintres.

Quant à ChatGPT, il est capable de disserter brillamment, à peu près dans toutes les langues, sur n’importe quel sujet pas trop récent. Et cela même en français, à propos de la littérature française :

© futurimmediat.net

Mais si on gratte sous le vernis de sa tchatche, le bot raconte n’importe quoi : les trois citations sont montées de toutes pièces, un Frankenstein vraisemblable – et totalement factice – prétendument extrait d’un livre qui, vérification faite, n’a jamais existé !

C’est d’autant plus pernicieux que, dans un domaine où on manque de compétence, l’assurance trompeuse de ChatGPT est extrêmement convaincante. Et comme il ne se trompe pas systématiquement, on a vite fait de croire que c’est juste une maladie de jeunesse, qui va s’arranger avec les corrections successives. Malheureusement, comme on le verra plus loin, c’est une espérance qu’il faut abandonner, et qui a d’ores et déjà conduit les geeks du monde entier à accorder à l’intelligence artificielle un crédit qu’elle ne mérite absolument pas.

En ce qui concerne la synthèse d’images, pour peu que l’on essaie de se servir des outils existants avec un minimum de sérieux, on finit par passer des nuits blanches à éliminer des tombereaux d’images grotesques, incohérentes ou simplement moches, dans l’espoir d’en trouver une seule qui tienne la route. Florilège :

© futurimmediat.net

Tristes coulisses : derrière les superbes images partagées par les geeks du monde entier se cachent une multitude de ces résultats inutiles, et des heures de fastidieux labeur digital.

Limites techniques, limites de conception

Si les systèmes d’IA dont on parle tant aujourd’hui échouent à dépasser certaines limites, c’est d’abord par manque de puissance et ensuite en raison de limites inhérentes à leur conception. Pour ce qui est du déficit de puissance, il suffit de se rappeler qu’un réseau de neurones artificiels est essentiellement un programme d’ordinateur, et qu’il est donc contraint par les limites d’un pc courant.

Un système d’IA typique est limité à quelques couches d’une centaine de neurones chacune, parce que tous les neurones d’une couche donnée doivent dialoguer avec chacun des neurones de la couche suivante et de la couche précédente, et donc chaque neurone supplémentaire augmente les besoins en ressources. Par comparaison, un cerveau humain comprend une bonne centaine de milliards de neurones. Et on pourrait mettre en avant de nombreuses autres différences.

Mais plus encore que les problèmes de puissance, c’est leur conception même qui rend les réseaux artificiels actuels cruellement inefficaces. Ces réseaux sont entraînés sur des corpus (d’images légendées, de phrases en contexte) et leur objectif est de produire, pour toute demande quelconque (légende dépourvue de l’image associée, question attendant une réponse) un complément vraisemblable (image, texte).

On obtient ce complément par tentatives successives, en produisant plusieurs assemblages de divers fragments pertinents du corpus original. L’assemblage finalement retenu sera celui qui, dans l’ensemble, semble statistiquement le plus proche des données du corpus. Comme le réseau de neurones ne dispose pas d’un modèle (pas de représentation mentale des mots utilisés dans les phrases, pas de notion des objets objets présents dans les les images) et que la ressemblance formelle avec le corpus constitue le seul critère de filtre, on a une vraisemblance purement superficielle, dépourvue de sens : les images produites avec Stable Diffusion sont souvent absurdes, les textes générés par ChatGPT peuvent révéler de profondes incohérences.

Le mirage fatal de l’autocorrection

On peut légitimement se poser la question : pourquoi les nouvelles IA génératives, comme ChatGPT ou Stable Diffusion, ne peuvent-elles pas corriger d’elles-mêmes leurs propres erreurs ? Ainsi, par exemple, le YouTuber Anastasi in tech, se demande pourquoi le système ne donne pas de lui-même un degré de confiance à ses résultats ?

La réponse est simple : du fait de leur manière de traiter l’information, les IA considèrent chacune de leurs productions comme la meilleure production possible : leur indice de confiance est de 100 % à chaque fois. En effet, de manière à obtenir le produit le plus vraisemblable, les AI optimisent déjà en permanence la cohérence de chaque fragment au sein de leur réponse. C’est même là le secret technique essentiel de leur fonctionnement.

Dans les générateurs d’images, on peut même contrôler de manière précise, et en divers endroits, le degré de hasard qu’on souhaite faire intervenir dans la génération : on peut régler le taux de conformité par rapport au texte (”guidance”), le degré de ressemblance du résultat avec une éventuelle image initiale, et sélectionner la matrice de bruit initiale (”seed”). Les chatbots basés sur GPT et les générateurs d’images à base de diffusion sont structurellement incapables d’évaluer la pertinence de leurs réponses et ne peuvent donc pas être améliorés dans ce domaine.

Quand qui peut le plus ne peut pas le moins

Les IA produisent de telles merveilles (images somptueuses, surprenantes et réalistes, réponses limpides et amplement documentées) que pour nous, humains, leurs erreurs évidentes, voire grossières (mains à six doigts, raisonnements incohérents…) paraissent par contraste extrêmement simples à éviter. Malheureusement, cette “évidence” est une projection anthropomorphique. Qui donc aurait un style écrit aussi brillant et serait en même temps incapable de disserter ? Qui donc serait en mesure de dessiner de si belle images et oublierait une jambe, voire un œil, de son personnage ? Réponse : les machines !

Quand on voit l’IA générer un enfant à trois jambes ou une main à dix doigts, on pense tout de suite, “qui peut le plus peut le moins, une machine tellement douée pourra forcément arriver à corriger ces bêtises”. Anthropomorphisme, fatale erreur : les machines ne pensent pas comme des êtres humains.

Rivés à leurs écrans, les geeks du monde entier s’imaginent que les limites intrinsèques des IA seront aisément dépassées, tant les inepties qu’elles contribuent à générer sont criantes : à force d’essais et d’erreurs, par itérations et corrections successives, on parviendra forcément à entraîner des systèmes fiables, capables de détecter par avance ces échecs évidents, et de les éliminer.

Mais non. Pour aider les machines à dépasser leurs limites, il ne suffira pas de leur apporter des améliorations à la marge : il faudra soit augmenter leur puissance, soit améliorer leur conception.

Dans le domaine de la puissance, les progrès sont dans le meilleur des cas contraints par la loi de Moore, selon laquelle le progrès technique permet de diviser la taille des transistors par deux tous les deux ans. Cette contrainte ne satisfait pas les exigences d’un réseau neuronal un peu costaud (rappelez-vous, chaque nouveau neurone fait croître de manière exponentielle le nombre d’interconnexions nécessaires à son fonctionnement). Or, tous les progrès récemment engrangés par les modèles GPT de génération de texte sont basés sur l’augmentation de puissance.

Il faudrait donc se tourner du côté de la conception. Mais les découvertes sont directement liées à la recherche et leur fréquence d’apparition n’est pas prévisible. Aujourd’hui, tous les systèmes populaires de génération d’images procèdent de la combinaison des modèles GPT avec une solution de conception relativement ancienne, la diffusion, inventée en 2015, et qui est à l’origine de tous les progrès qu’on a pu voir en 2022. On ne sait absolument pas quand on aura à nouveau la joie d’assister à une découverte autorisant un progrès d’une telle ampleur.

Tout bien considéré, la geekosphère peut redescendre de son perchoir, rien ne garantit que la prochaine révolution nous attende au coin de la rue.

Proprioception, affects, et conscience, insurmontables limites de l’IA ?

Notre intelligence humaine est multimodale : lorsque nous prononçons un mot, celui-ci ravive une série d’expériences préalablement mémorisées qui sont intellectuelles, pratiques (réponse à la question “que puis-je faire ?”), perceptives (visuelles, auditives, tactiles, olfactives, gustatives), proprioceptives (liées à nos sensations corporelle internes) et, par-dessus tout, émotionnelles. Ainsi le mot “chat” c’est conceptuellement un “animal domestique non-chien”, lié à un tas de perceptions dont des déplacements souples, une couleur et une fourrure, les miaulements, les ronronnements, l’odeur du chat, celle des croquettes qu’on lui donne, la fourrure qu’on touche, l’animal qu’on caresse et grattouille, qu’on nourrit et à qui on doit ouvrir la porte, etc. Sans parler des liens affectifs et des rapports psychologiques qu’on peut entretenir avec un chat, domaines dans lesquels on fera sans doute bien de ne pas se cantonner aux instructions d’un chat-bot.

Cette réalité multidimensionnelle et imbriquée de la mémoire, thématique des romans de Marcel Proust, constitue la limite théorique de l’approche binaire de l’intelligence. Son importance pour la compréhension des énoncés et des images avait été démontrée au plan théorique par quelques sémanticiens mal connus du grand public, comme l’américain Georges Lakoff (Metaphors we Live By) et le belge Henri Van Lier (L’Animal Signé). Cette vision théorique est à présent étayée par des expériences récentes d’imagerie cérébrale, qui ont effectivement rendu visibles, lors de la prononciation d’un mot, l’activation à travers tout le cerveau humain, de réseaux multi-fonctionnels spécifiquement associés à ce mot (conversement, l’imagerie en question permet aussi de plus ou moins bien deviner à quoi pense la personne observée !). En somme, l’expérience humaine liée à la corporéité et aux affects constitue un versant de l’intelligence qui restera probablement à jamais hors de portée des machines électroniques.

Quant à la conscience, manifestement, on nous vend de la peau de Yéti : d’année en année, les spécialistes reportent encore et encore à plus tard leurs prédictions quant l’apparition d’une IA consciente et autonome, ou “General Purpose AI” (intelligence artificielle généraliste), qui prendrait sa destinée en mains. Demain, la Singularité rase gratis.

Dernière annonce en date, la fameuse “interview” de LaMDA, le système d’IA de Google, soi-disant devenu capable de ressentir et conscient de lui-même. Suite à cette fumeuse publication, Google a pris ses distances avec l’auteur et a publié un démenti. Le misérable article inspire même à présent un discours appelant à une évaluation plus raisonnable des systèmes actuels. Another hoax bites the dust.

Si on considère que proprioception, affects et conscience font partie intégrante de l’intelligence, alors il n’y a aucune raison légitime d’utiliser ensemble les mots “intelligence” et “artificielle”.

Michelange Baudoux, sémanticien et blogueur


[INFOS QUALITE] statut : validé | mode d’édition : partage, édition, correction et iconographie (l’article original contient plus d’illustrations et de références) | sources : futurimmediat.net | contributeur : Patrick Thonart | crédits illustrations : en-tête, © futurimmediat.net.


Plus de dispositifs en Wallonie-Bruxelles…

GEOFFRAY, Agnès (née en 1973)

Temps de lecture : 5 minutes >

La plasticienne Agnès Geoffray transforme la survivance des traces de l’histoire, sous forme de photographies, et pose la question : que reste-t-il de l’image ?

Il ne s’agit pas pour elle simplement de savoir ce qu’elle signifie puisqu’il faut s’interroger sur sa vie et sa transmission. Sa méthode fonctionne plus par résonance, dans ses réalisations, par une mise en forme soignée : l’image intègre les aspects historiques et sociaux, en plus de son rapport à l’esthétique.

Elle ne cesse d’analyser les détails d’un cliché par rapprochement et similitude. Par une sorte de symbiose entre le croire et l’agir, elle mêle l’évidence supposée et l’étrangeté. Elle touche le regard du spectateur, mais aussi ébranle la condition de l’implication du corps.

C’est sous forme d’allers et retours du modèle originel vers celui, transformé, de l’artiste que se constitue l’essence même de son travail, par un mouvement mais aussi par le constat de la prise de conscience des plis qui, pris ensemble, éclairent la matrice d’où elle se déplace. En témoignent le foulard militaire en soie imprimée de cartes de la seconde guerre mondiale, ou le “Parachute” (2019) de la même époque, sur lequel des mots sont brodés en rouge.

Son approche, par une série de fragments fondateurs de l’œuvre, fait le lien entre l’avant et l’après, par la découverte de perspectives restées inaperçues. En gommant ou modifiant des détails, elle falsifie des images vernaculaires issues d’archives afin de mieux les recontextualiser. Dès lors, se posent les questions : comment l’image nous parvient-elle ? Quelle est leur puissance historique et leur part de fiction ?

Des images qui prennent racines dans des représentations violentes de conflits, largement étudiés. Agnès Geoffray en fabrique une nouvelle version pour agir sur leur réalité. Par un travail d’ajustement, elle établit des rapports depuis un angle déviant, et entraîne le regardeur, détourne son attention qui ne porte plus uniquement sur la surface mais sur le contenu.

Dans le diptyque, “Libération 1 et 2” (2011), elle interroge ce qui se dérobe au premier regard. Elle se méfie de ce qui saute aux yeux. Elle bondit par-dessus la linéarité du temps. Une renaissance avant de replonger à la source. En “en robant” le corps de cette femme, on passe d’une scène violente avec les sourires satisfaits des hommes qui saisissent ses poignets, à pratiquement une scène de danse dans la rue. En sélectionnant un détail, une action, un tremblement, elle nous immobilise dans l’égarement.

Tout au contraire et c’est sa force, elle recadre en décalant, d’un autre point de vue, pour provoquer une nouvelle attention. Après un silence, dont la durée dépend du temps passé à la stupéfaction de l’emprise ou victimisation.

Il existe dans les actes d’Agnès Geoffray une répétition du mode opératoire du motif, quelque chose qui insiste dans ses actes de regard. “Le choc de l’obus” qui a atteint des milliers d’hommes pendant le cataclysme, transmis par le danseur Jérôme Andrieu, vacillant, sous forme de vidéo, est d’une exemplarité accomplie.

Pour comprendre une image, l’expérience enseigne qu’il faut se mettre, en la regardant, à l’écoute de sa teneur temporelle. Selon un rythme souvent binaire qui implique l’image (ou l’objet). Simultanément, la plasticienne combine des emblèmes dupliqués, fréquemment en binôme ou plus, chacun d’entre eux présente un détail différent du voisin, en décalage. Les variations se révèlent complexes parfois, bourrées d’interférences, par des assauts irréguliers, espacés, accélérés, puis ralentis. Parfois, face à des photographies manquantes, elle fournit elle-même le matériau, sous forme visuelle ou grâce à son propre alphabet, des histoires écrites. “Résultant d’un processus de reconstruction fictionnalisée”, précise-t-elle, l’artiste invente des histoires, dont certaines utilisent un vocabulaire dix-neuvièmiste.

Les mots sont souverains dans ses créations. Dans “Palimpsestes” (2012), les verbes sont épinglés au mur. Des papiers et tracés, d’une écriture secrète, donnent voix et corps à un langage oublié dans les “Messagers” (2014). Ou, encore, ces écrits, appels à la résistance, qui ont valeur de tracts, glissés dans les poches des soldats allemands.

Il en surgit un passé qui percole le présent, une interprétation fine, poétique et politique de l’histoire, à travers le pouvoir des images.” [ARTAIS-ARTCONTEMPORAIN.ORG]

L’inquiétante étrangeté d’Agnès Geoffrey

“Agnès Geoffray n’est pas à proprement parler photographe mais plutôt une manipulatrice de signes, qu’il s’agisse de l’écriture qui représente une grande partie de son travail (relativement peu connue) ou des images qu’elle manipule, soit en détournant par réappropriation des photographies glanées, soit en mettant en scène des situations auxquelles elle donne un aspect ordinaire, comme si elles appartenaient à la première catégorie des images récupérées (collectionnées, altérées, réassignées). Dans son travail d’écriture le procédé est identique, elle récupère, oblique, altère des textes existants ou crées mais qu’elle traite comme des éléments abandonnés, trouvés, retrouvés.

Toute son œuvre est marquée donc par le palimpseste, la réécriture sur ce qui a déjà existé, qui n’est plus tout à fait là et qu’elle réactive. L’image photographique est toujours déjà absente. Elle appartient d’emblée à la grande circulation des signes de la mémoire collective et personnelle qui fonctionnent par identification assimilatrice, projection, appropriation et récupération. C’est dans cet interstice que les obsessions d’Agnès Geoffray viennent se loger.

Agnès Geoffrey et la circulation des images

Agnès Geoffray, quand elle parle de son travail, en appelle fréquemment au flux (rhizomique) qui relie les images par associations ou disjonctions. Les images sont, au même titre que les mots, des signes d’une grammaire générale qui fait que l’on ne voit pas des nuances mais une forme identifiable, un arbre, un geste, un bourgeois, une femme du peuple, une photographie de famille ou un moment de l’histoire collective. Les images sont des éléments mémoriels qui ont, en outre, une valeur d’indice. Elles se réfèrent à un moment irrémédiablement révolu que notre travail de gestation, une sorte de parturition de seconde main, réactualise.

C’est là, dans la relation de réappropriation (…), qu’intervient Agnès Geoffray. La photographie n’est totalement révélée que dans une forme chimique et sensible de palimpseste. C’est ce que la plasticienne photographe s’évertue à distordre par retouches ou mises en scène. Elle interfère dans la circulation globale des signes visuels photographiques, mais aussi dans le moment où l’image interpelle le regardeur. Alors que l’image picturale est en quelque sorte immanente, elle se donne comme un tout juxtaposé inséré dans l’histoire des arts, la photographie appelle toujours, dès le premier regard, quelque chose d’autre qu’elle-même. Le travail d’Agnès Geoffray oscille entièrement dans cet interstice où ses propres digressions sémiotiques tentent de provoquer l’altérité par laquelle l’Inquiétante Etrangeté (Unheimliche) pourra surgir et conduire à d’autres associations plus ou moins dérangeantes, selon l’histoire de chacun.

L’angoisse et le palimpseste

L’Inquiétante Étrangeté est, pour faire court, le moment où l’identification dysfonctionne, c’est l’instant où ce qui est familier se dérobe parce qu’il est impossible d’assigner clairement à ce qui se produit une identité fixe et claire, l’altérité surgit dans l’ordre familier et génère une angoisse inexplicable. Dans son travail de réécriture Agnès Geoffray vise à susciter, par des décalages subtils, un glissement similaire qui conduit inexorablement vers l’indéfinissable.

Dans le corpus de l’artiste plasticienne il y a autant de réappropriations que de créations, pourtant, il n’est pas toujours aisé de faire le partage. Chaque image paraît ordinaire, les gris sont ceux des anciennes photographies familiales, les cadrages sans effet formel, les situations souvent banales, la position du photographe frontale, à hauteur d’œil. La banalité formelle est une chausse-trappe. Le regardeur ne se méfie pas plus que lorsqu’il feuillette un album de famille. Pourtant rien ne “colle” dans ces compositions (collages, rencontres arbitraires) ou recompositions.” [Lire l’article complet sur ARTEFIELDS.NET]

Visiter le site d’AGNES GEOFFRAY


[INFOS QUALITE] statut : actualisé | mode d’édition : compilation par wallonica.org  | contributeur : Philippe Vienne | crédits illustrations : © Agnes Geoffrey


Plus d’arts visuels…