L'État et les grandes transitions

29/06/2023

ChatGPT : le diable s’habille-t-il en data ?

Depuis quelques semaines, le monde s’émerveille devant les capacités quasi-magiques de l’agent conversationnel ChatGPT. Très puissant, l’outil a été développé par la jeune société OpenAI créée entre autres par Elon Musk qui finira par prendre ses distances avec la startup, inquiet de voir l’intelligence artificielle devenir un « risque fondamental pour la civilisation humaine ». Si ChatGPT représente une nouvelle étape dans l’évolution et la démocratisation de l’intelligence artificielle, au point de concurrencer Google, les conséquences potentielles et avérées sur son utilisation interrogent dans la société jusqu’au législateur. Plus largement, faut-il encadrer les capacités exponentielles de l’intelligence artificielle ? Si oui, quels garde-fous mettre en place pour en limiter les conséquences ?

A l’origine était l’algorithme

Tout a été dit ou presque sur les capacités incroyables de ChatGPT. Mais pour bien les comprendre, il faut remonter à l’origine de l’intelligence artificielle et de la création des algorithmes. Selon Serge Abiteboul, chercheur et informaticien à l’Institut national de recherche en sciences et technologies du numérique (INRIA), « un algorithme est une séquence d’instructions utilisée pour résoudre un problème ». Sans forcément le savoir, nous en utilisons chaque jour quand nous cuisinons à l’aide d’une recette : nous respectons un ordre précis d’instructions pour créer un plat, c’est le principe même d’un algorithme. Si nous remontons le temps, les premiers algorithmes servaient à calculer l’impôt alors que, dans le champ mathématique, le premier remonte à -300 avant notre ère. Nous le devons à Euclide qui inventa l’algorithme qui calcule le plus grand commun diviseur de deux entiers. C’est Alan Turing, considéré comme le père fondateur de l’informatique, qui donna en 1936 le premier support formel aux notions d’algorithmiques avec sa célèbre machine considérée encore aujourd’hui comme un modèle abstrait de l’ordinateur moderne.

A partir du XXème siècle, la grande nouveauté dans l’exploitation des algorithmes a résidé dans l’utilisation d’ordinateurs aux capacités de calculs décuplées. Après les années 50, leur développement s’est accéléré grâce au machine learning ou apprentissage automatique. Cette technologie d’intelligence artificielle permet aux ordinateurs d’apprendre à générer des réponses et résultats sans avoir été programmés explicitement pour le faire. Autrement dit, le machine learning apprend aux ordinateurs à apprendre, à la différence d’une programmation informatique qui consiste à exécuter des règles prédéterminées à l’avance. Pour y arriver, les algorithmes d’intelligence artificielle doivent consommer des volumes considérables de données et utiliser des probabilités statistiques. Les plus célèbres d’entre eux, nous les utilisons tous les jours. Le premier est PageRank, l’algorithme de Google qui établit avec pertinence un classement des pages web quand nous effectuons une recherche sur son moteur. Les fils d’actualité de Facebook ou Twitter sont également de puissants algorithmes utilisés chaque jour par des centaines de millions d’utilisateurs. Les algorithmes sont devenus tellement efficaces qu’ils sont à l’origine d’un enrichissement des plateformes, sans commune mesure avec celui des entreprises d’autres secteurs. Ces plateformes, nous les connaissons bien. Elles nous accompagnent dans les actes de notre vie quotidienne : elles nous permettent de regarder une série ou un film, d’écouter de la musique, de faire nos courses, de voyager, de partir en vacances ou encore de trouver un logement ou l’amour. Grâce au perfectionnement de l’intelligence artificielle, les plateformes exploitent toujours plus de données, ce qui rend possible un meilleur apprentissage des algorithmes. Ce modèle économique basé sur la donnée leur permet de créer des nouveaux services qui recueillent encore plus de données et alimentent ainsi la croissance de leurs revenus. La capitalisation boursière des GAFAM n’a pas fini d’atteindre des sommets dans les années à venir.

Aujourd’hui, c’est la technique du deep learning – apprentissage profond – sous-domaine du machine learning qui attire le plus l’attention après avoir été boudée pendant longtemps. Son retour en grâce, on le doit notamment à un Français, Yann Le Cun, actuellement chercheur en intelligence artificielle chez Facebook et lauréat du prix Turing en 2019. La technique du deep learning utilise des réseaux neuronaux artificiels, calqués sur ceux des humains, pour obtenir un résultat. Les champs d’applications sont nombreux (médecine, robotique, sécurité informatique, création de contenus…). Ils intéressent beaucoup les géants technologiques qui investissent massivement dans le développement de cette technique. ChatGPT interprète ainsi les données qui l’ont nourri – on parle quand même de plus de 500 milliards de textes et vidéos – en s’appuyant sur des algorithmes d’apprentissage automatique et de traitement du langage, mais aussi sur des techniques d’apprentissage profond. Les réseaux de neurones artificiels utilisés lui permettant ainsi de mieux comprendre les relations entre les mots dans une phrase et de les utiliser plus efficacement pour générer des phrases cohérentes et pertinentes.

Un succès fulgurant et jamais vu par le passé

L’efficacité de ChatGPT est à l’origine de son succès auprès du grand public. Il n’aura fallu que cinq jours à l’outil développé par OpenAI lancé en novembre 2022 pour atteindre un million d’utilisateurs. Instagram aura mis un peu plus de deux mois pour atteindre ce résultat, Spotify cinq mois, Facebook dix mois et Netflix plus de trois ans. Un succès fulgurant qui a fait vaciller Google de son piédestal, pour le plus grand bonheur de Microsoft, propriétaire du moteur de recherche Bing, qui a investi un milliard de dollars dans ChatGPT. Aux USA, Google représente 88% du marché des moteurs de recherche contre 6,5% pour Bing. En France, Google représente même plus de 90% du marché. Très prochainement, Microsoft va lancer une version améliorée de Bing dopée à l’intelligence artificielle ChatGPT. En seulement 48 heures, plus d’un million d’internautes se sont déjà inscrits sur la liste d’attente pour l’essayer. Une occasion unique pour Microsoft, acteur mineur du marché des moteurs de recherche, de concurrencer Alphabet, la maison-mère de Google. La présentation catastrophique de Bard, le concurrent de ChatGPT, par le vice-président de Google, Prabhakar Raghavan, début février n’a rien arrangé. En une journée, Google a perdu plus de cent milliards de dollars de capitalisation boursière à cause d’une simple erreur factuelle commise en direct par le nouvel outil d’intelligence artificielle. Une bourde reprise en boucle sur les réseaux sociaux et sur les chaînes d’information en continue. Pour la première fois dans son histoire, Google semble menacé par une technologie développée par un concurrent. De son côté, l’action de Microsoft se porte comme un charme depuis le début de l’année. La firme devrait même investir plus de 10 milliards de dollars dans OpenAI dans les années à venir, notamment pour obtenir l’exclusivité de certaines fonctions du chatbot.

Sommes-nous aux prémices d’une simple recomposition du marché des moteurs de recherche ou le succès de ChatGPT représente-il bien plus que celui d’un simple agent conversationnel ? Techniquement, l’outil développé par OpenAI ne représente pas une rupture technologique, même si ChatGPT bénéficie de véritables innovations concernant par exemple le contrôle des réponses apportées aux internautes grâce à un logiciel dédié. Ce dernier lui a permis jusqu’à présent de ne pas tomber dans le piège de la dérive raciste comme d’autres intelligences artificielles avant elle. En 2016, l’intelligence artificielle Tay, développée par Microsoft, était devenue la risée d’internet en tweetant des messages nazis, 24 heures seulement après son lancement. Capable d’apprendre de ses interactions avec les internautes, elle avait fini par tweeter plus rapidement que son ombre des propos racistes ou xénophobes très choquants. « Hitler a fait ce qu’il fallait, je hais les juifs », « Bush a provoqué le 11 septembre et Hitler aurait fait un meilleur travail que le singe que nous avons actuellement », « je hais les féministes, elles devraient toutes brûler en enfer. », font partis des pires tweets qu’elle a diffusé avant que son compte, qui comptabilise toujours plus de 100 000 abonnés, ne passe en mode privé.

Avec ChatGPT, les moteurs de recherche devraient rapidement évoluer pour devenir de vrais moteurs de solution. Plutôt que d’afficher des pages et des pages de résultats pour une simple recherche, les prochains moteurs proposeront directement une réponse précise et argumentée en se nourrissant des sites mis à leur disposition. Un constat qui a récemment mis en émoi plusieurs écoles new-yorkaises qui ont littéralement interdit à leurs élèves d’utiliser l’outil. Une décision qui sera de plus en plus difficile à tenir quand on sait que ChatGPT va rapidement devenir encore plus efficace. La version actuelle dispose de 175 milliards de paramètres alors que la version précédente de ChatGPT n’en possédait seulement que 1,5 milliard.

Au-delà des capacités exponentielles de l’intelligence artificielle développée par OpenAI, c’est son adoption rapide par les internautes qui impressionne. Accessible à tous et gratuit, l’outil a démocratisé le recourt à l’intelligence artificielle dans de nombreux aspects de la vie quotidienne et professionnelle, ce qui n’avait pas vraiment réussi avant ses principaux concurrents. Selon Microsoft : « le nouveau Bing est à la fois un assistant de recherche, un planificateur personnel et un partenaire créatif. » De quoi aiguiser la curiosité du plus grand nombre et en faire un outil incontournable, sachant que ChatGPT a réussi là où les autres chatbots ont toujours échoué : soutenir une conversation en se souvenant des réponses précédentes que l’internaute lui a fournies. Selon les prédictions de Kevin Roose, journaliste technologique au New York Times et auteur de trois livres sur l’intelligence artificielle et l’automatisation, l’intelligence artificielle pourrait également à terme être utilisée comme un thérapeute personnalisé… Au risque de faire disparaitre le métier de psychologue ?

Et demain ?

Il semblerait que ce ne soit pas le seul métier que cette intelligence artificielle menace, même si les prévisions dans ce domaine se sont souvent avérées fausses. Dans un premier temps, ce sont les métiers d’assistants qui sont le plus menacés. Depuis 2016, Ross travaille pour le cabinet d’avocats américain Baker & Hostetler. Il a plus de 900 collègues qui lui demandent de l’assister dans leur travail au quotidien. Surdoué — il est capable de traiter un milliard de documents par seconde — Ross est spécialisé dans l’étude des faillites d’entreprises. Il n’est pas un employé comme les autres, c’est un “avocat robot” doté d’une intelligence artificielle développée par la société IBM, à partir de la célèbre technologie Watson. Son efficacité est telle qu’il vient concurrencer directement les jeunes avocats chargés jusqu’à présent d’assister leurs collègues et de rechercher les documents liés aux questions légales qui se posent. D’autres solutions encore plus efficaces que celles développées par IBM feront leur apparition dans les prochaines années, au fur et à mesure que la technologie se développera et que les algorithmes peaufineront leur apprentissage. D’autres secteurs d’activités seront impactés en profondeur par l’efficacité des agents conversationnels. Dans un premier temps, il est plus que probable que les intelligences artificielles d’OpenAI soient déployées dans tous les logiciels de Microsoft, l’entreprise ayant déjà annoncé qu’elle utiliserait DALL-E, générateur d’images et petit frère de ChatGPT, dans PowerPoint pour créer des images uniques. Plus globalement, les métiers créatifs, comme ceux de la communication ou du journalisme, devraient subir une mutation profonde et rapide. Dans les années à venir, ChatGPT sera aussi un outil précieux pour répondre à des commandes vocales ou encore lire des courriels, ce qui sera d’une grande aide pour les personnes souffrant par exemple de cécité.

Mais l’utilisation en masse de ChatGPT soulève d’autres interrogations, d’ordre moral et éthique. Selon une enquête réalisée par le magazine Time, si le logiciel permettant à l’outil de ne pas sombrer dans le raciste et la xénophobie est si efficace c’est grâce au travail de modérateurs kenyans payés seulement 2 euros de l’heure. Leur quotidien ? Trier les informations pour réduire le risque de réponses discriminantes ou encore haineuses. Certains s’estimeront même traumatisés par le contenu lu pendant des semaines. Un autre scandale interroge la responsabilité de l’entreprise dans le respect du droit d’auteur. Des centaines de milliards de données ont été utilisées pour entrainer l’intelligence artificielle sans s’interroger en amont sur le consentement de tous ceux qui ont nourri ChatGPT. Se pose alors la question de la transparence sur les données et les sources utilisées par l’intelligence artificielle. A l’avenir, elles devront apparaître clairement lors de la délivrance d’une réponse à une question posée. Se pose également la question de la transparence sur les contenus générés par une intelligence artificielle. En effet, à l’heure des deep fakes, il est de plus en plus difficile de distinguer le faux du vrai. Comme le souligne Julien Deslangle, auteur et prospectiviste, dans une tribune (1) mise en ligne sur le site Uzbek & Rica le 10 janvier dernier : « bien sûr, l’Homme n’a pas attendu l’IA générative pour créer et diffuser de fausses informations, mais les algorithmes peuvent le faire de façon plus convaincante, comme en témoignent les hypertrucages (ou deep fakes), ces enregistrements qui peuvent prêter à une personnalité des propos qu’elle n’a jamais tenus. En mars dernier, des pirates ont ainsi diffusé sur des sites ukrainiens un deep fake dans lequel le président Volodymyr Zelensky demandait à ses soldats de déposer les armes face à la Russie… ».

Le législateur devra alors trouver les réponses adéquates, sans tomber dans la censure systématique, alors que le débat se déplace aujourd’hui sur le terrain de la sécurité. Comme le soulignait Danny Gagné, chercheur à l’Université du Québec à Montréal, sur son blog (2) le 31 janvier dernier : « des chatbots utilisant l’IA peuvent générer, de manière autonome, du code propre à mener des attaques au rançongiciel. Fini le temps où ce type d’entreprise était réservé aux génies de l’informatique : les équipes de recherche de la firme de cybersécurité israélienne Check Point ont démontré que des cybercriminels avec peu ou pas d’expérience étaient en mesure d’utiliser ChatGPT pour encoder des courriels d’hameçonnage contenant des logiciels espions. »

Certains politiques s’interrogent de leur côté sur l’idéologie développée par ChatGPT. A droite, certains estiment que l’outil fait preuve de censure en ne répondant pas expressément à certaines questions ou alors privilégie des réponses qui promeuvent une idéologie très progressiste. Le mercredi 15 janvier, Sonia Mabrouk s’est prêtée une nouvelle fois à l’exercice de l’interview politique sur Europe 1 mais cette fois-ci en interrogeant ChatGPT, dans une mise en scène très travaillée (3), pour savoir si l’intelligence artificielle « a une matrice idéologique, un corpus de valeurs ». A la question sur son objectivité, ChatGPT répond : « je suis programmé pour être le plus objectif possible dans mes réponses. Cependant il est important de noter que les algorithmes qui me contrôlent sont basés sur les données d’apprentissage sur lesquelles j’ai été formé. Et ces données peuvent refléter les biais et les opinions de ceux qui ont créé ces données. Mon objectivité dépend donc de la qualité et de l’objectivité des données d’entrainement qui m’ont été fournies (…) » La journaliste lui demande ensuite de créer un poème féministe, ce qu’il fait, avant de lui demander d’en créer un second antiféministe et misogyne, ce qu’il refuse de faire. La démonstration est implacable : ChatGPT semble répondre, comme le souligne la journaliste, en fonction « de valeurs qui lui ont été inculqués. On vous a dit ce qui était bien ou mal ? » Elle lui posera ensuite des questions sur l’immigration ou encore sur l’identité de genre, dénonçant au passage le « catéchisme de la théorie du genre » soi-disant développé par l’intelligence artificielle. « Ce sont des adeptes du woke qui vous ont inculqués ses valeurs ? » Si les réponses de ChatGPT n’ont pas rassuré la journaliste, une chose est sûre : l’intelligence artificielle est bien de gauche !

Et à plus long terme ? A quoi pourrait ressembler notre vie en cohabitation avec une intelligence artificielle de plus en plus sophistiquée ? Avec – pourquoi pas – le concours de l’informatique quantique et ses capacités hors norme de calcul, l’efficacité de l’intelligence artificielle sera décuplée. Elle accompagnera les citoyens dans leur vie quotidienne en prenant des décisions à leur place. De nombreuses sociétés spécialisées dans la personnification de l’intelligence artificielle verront le jour. Il n’existera plus comme aujourd’hui une intelligence artificielle faible et abstraite, mais des intelligences artificielles paramétrables et ultra-performantes.

Références

(1) https://usbeketrica.com/fr/article/pour-une-obligation-de-transparence-sur-les-contenus-generes-par-l-ia

(2) https://dandurand.uqam.ca/publication/chatgpt-co-le-cote-obscur-de-lintelligence-artificielle/

(3) https://www.europe1.fr/societe/chatgpt-est-il-woke-4167109