Qu’est-ce que l’IA générative?

| Article

Les systèmes d’IA générative font partie de la vaste catégorie de l’apprentissage automatique, et voici comment l’un de ces systèmes – ChatGPT – décrit ce qu’il peut faire :

Êtes-vous prêts à faire passer votre créativité au niveau supérieur? Ne cherchez plus : utilisez l’IA générative! Cette forme astucieuse d’apprentissage automatique permet aux ordinateurs de générer toutes sortes de contenus nouveaux et passionnants, allant de la musique et de l’art à des univers virtuels entiers. Et ce n’est pas qu’une question de divertissement : l’IA générative compte également de nombreuses utilisations pratiques, comme la création de nouveaux produits et l’optimisation des processus d’affaires. Alors, pourquoi attendre? Exploitez la puissance de l’IA générative et découvrez les créations étonnantes que vous pouvez réaliser!

Un élément de ce paragraphe vous a-t-il semblé anormal? Peut-être pas. La grammaire est parfaite, le ton fonctionne et la narration est fluide.

Que sont ChatGPT et DALL-E?

C’est pourquoi ChatGPT – GPT signifie generative pretrained transformer (transformateur génératif préentraîné) – suscite tant d’intérêt en ce moment. Il s’agit d’un robot conversationnel gratuit qui peut générer une réponse à presque toutes les questions qui lui sont posées. Développé par OpenAI et mis à la disposition du grand public à des fins de test en novembre 2022, il est déjà considéré comme le meilleur robot conversationnel de tous les temps. Il est aussi très populaire : plus d’un million de personnes se sont inscrites pour l’utiliser en seulement cinq jours. Des admirateurs enthousiastes ont publié des exemples du robot produisant du code machine, des dissertations de niveau universitaire, des poèmes et même d’assez bonnes blagues. D’autres personnes – parmi le large éventail qui gagne sa vie en créant du contenu, des rédacteurs publicitaires aux professeurs permanents – tremblent de peur.

Si beaucoup ont réagi avec crainte à ChatGPT (et plus généralement à l’IA et à l’apprentissage automatique), il est clair que cet outil a un potentiel positif. Depuis son déploiement à grande échelle, l’apprentissage automatique a démontré son utilité dans un certain nombre de secteurs, notamment pour l’analyse de l’imagerie médicale et les prévisions météorologiques à haute résolution. Un sondage de 2022 effectué par McKinsey démontre que l’adoption de l’IA a plus que doublé au cours des cinq dernières années, et les investissements dans l’IA augmentent rapidement. De toute évidence, les outils d’IA générative tels que ChatGPT et DALL-E (un outil d’art généré par IA) ont le potentiel de modifier la façon dont de nombreux emplois sont exécutés. L’ampleur de cet impact demeure toutefois inconnue, tout comme les risques qui s’y rattachent. Mais nous pouvons répondre à certaines questions, comme la manière dont les modèles d’IA générative sont construits, les types de problèmes qu’ils sont le mieux à même de résoudre et la place qu’ils occupent dans la catégorie plus large de l’apprentissage automatique. Continuez votre lecture pour mieux comprendre.

Learn more about QuantumBlack, AI by McKinsey.

Quelle est la différence entre l’apprentissage automatique et l’intelligence artificielle?

L’intelligence artificielle est essentiellement ce qu’elle semble être : une pratique consistant à amener des machines à imiter l’intelligence humaine pour effectuer des tâches. Vous avez probablement déjà interagi avec de l’IA sans le savoir : les assistants vocaux comme Siri et Alexa sont fondés sur la technologie de l’IA, tout comme les robots de service à la clientèle qui apparaissent pour vous aider à naviguer sur les sites web.

L’apprentissage automatique est un type d’intelligence artificielle. Grâce à l’apprentissage automatique, les praticiens développent l’intelligence artificielle au moyen de modèles qui peuvent « apprendre » à partir de schémas de données sans intervention humaine. La quantité ingérable et la complexité des données (ingérables par les humains, du moins) qui sont aujourd’hui générées ont décuplé le potentiel de l’apprentissage automatique, ainsi que sa nécessité.

Quels sont les principaux types de modèles d’apprentissage automatique?

L’apprentissage automatique repose sur un certain nombre de composantes, à commencer par les techniques statistiques classiques développées entre le 18e et le 20e siècle pour de petits ensembles de données. Dans les années 1930 et 1940, les pionniers de l’informatique, dont le mathématicien Alan Turing, ont commencé à travailler sur les techniques de base de l’apprentissage automatique. Mais ces techniques sont restées confinées aux laboratoires jusqu’à la fin des années 1970, lorsque les scientifiques ont commencé à mettre au point des ordinateurs suffisamment puissants pour les appliquer.

Jusqu’à tout récemment, l’apprentissage automatique était largement limité aux modèles prédictifs, utilisés pour observer et classer des tendances dans un contenu donné. Par exemple, un problème classique d’apprentissage automatique consiste à partir d’une image ou de plusieurs images de chats adorables. Le programme doit ensuite repérer des schémas parmi les images, puis examiner minutieusement des images aléatoires pour trouver celles qui correspondent au schéma de l’adorable chat. L’arrivée de l’IA générative a représenté une véritable avancée. En effet, plutôt que de simplement percevoir et classer une photo de chat, l’apprentissage automatique est désormais capable de créer une image ou une description textuelle d’un chat sur demande.

Comment fonctionnent les modèles d’apprentissage automatique fondés sur le texte? Comment sont-ils préparés?

ChatGPT fait peut-être la une des journaux en ce moment, mais ce n’est pas le premier modèle d’apprentissage automatique basé sur le texte à faire sensation. Le GPT-3 d’OpenAI et le BERT de Google ont tous deux été lancés ces dernières années et ont suscité un certain engouement. Mais avant ChatGPT, qui, de l’avis général, fonctionne plutôt bien la plupart du temps (bien qu’il soit encore en cours d’évaluation), les robots conversationnels intelligents n’ont pas toujours reçu les meilleures critiques. Le GPT-3 est « tour à tour très impressionnant et très décevant », a déclaré Cade Metz, journaliste technologique au New York Times, dans une vidéo où lui et la rédactrice culinaire Priya Krishna demandaient au GPT-3 d’écrire des recettes pour un souper de l’Action de grâce (qui s’est avéré plutôt désastreux).

Les premiers modèles d’apprentissage automatique à travailler avec du texte ont été entraînés par des humains pour classer diverses données en fonction de catégories définies par des chercheurs. Un exemple serait un modèle formé pour classer les messages des médias sociaux comme étant positifs ou négatifs. Ce type d’apprentissage est connu sous le nom d’apprentissage supervisé, car un humain est chargé d’« enseigner » au modèle ce qu’il doit faire.

La prochaine génération de modèles d’apprentissage automatique basés sur le texte repose sur ce que l’on appelle l’apprentissage autosupervisé. Ce type d’entraînement consiste à alimenter un modèle avec une quantité massive de texte afin qu’il devienne capable de générer des prédictions. Par exemple, certains modèles peuvent prédire, à partir de quelques mots, la fin d’une phrase. Avec un nombre suffisant d’échantillons de texte – par exemple, une grande partie de l’internet – ces modèles basés sur le texte deviennent très précis. Et nous constatons désormais à quel point ils sont précis grâce au succès d’outils tels que ChatGPT.

Que faut-il pour construire un modèle d’IA générative?

La création d’un modèle d’IA générative a été en grande partie une tâche incommensurable, à tel point que seuls quelques grands noms de la technologie bien dotés en ressources ont tenté de s’y atteler. OpenAI, la société à l’origine de ChatGPT, des anciens modèles GPT et de DALL-E, a reçu des milliards de dollars en financement de la part de donateurs célèbres. DeepMind est une filiale d’Alphabet, la société mère de Google, et Meta a lancé son produit Make-A-Video qui s’appuie sur l’IA générative. Ces sociétés emploient certains des meilleurs informaticiens et ingénieurs du monde.

Mais il n’est pas uniquement question de talent. Lorsque vous demandez à un modèle de s’entraîner en utilisant la quasi-totalité de l’internet, cela vous coûte cher. OpenAI n’a pas divulgué les coûts exacts, mais les estimations indiquent que GPT-3 a été formé sur environ 45 téraoctets de données textuelles – ce qui représente environ un million de pieds de rayons de bibliothèque, ou un quart de la Library of Congress – pour un montant estimé à plusieurs millions de dollars. Il ne s’agit pas de ressources auxquelles toutes les jeunes entreprises peuvent avoir accès.

Quels types de résultats un modèle d’IA génératif peut-il produire?

Comme vous l’avez peut-être remarqué ci-dessus, les résultats des modèles d’IA générative peuvent être impossibles à distinguer du contenu généré par l’humain, mais ils peuvent aussi sembler un peu étranges. Les résultats dépendent de la qualité du modèle – comme nous l’avons vu, les résultats de ChatGPT semblent jusqu’à présent supérieurs à ceux de ses prédécesseurs – et de la correspondance entre le modèle et le cas d’utilisation, ou les données de départ.

En dix secondes, ChatGPT peut produire une dissertation comparant les théories du nationalisme de Benedict Anderson et d’Ernest Gellner qui mériterait une note de A-, selon un commentateur. Il a également reproduit un passage déjà célèbre décrivant comment retirer un sandwich au beurre d’arachide d’un magnétoscope dans le style de la Bible du roi Jacques. Les modèles artistiques générés par l’IA comme DALL-E (dont le nom est un mélange de l’artiste surréaliste Salvador Dalí et du sympathique robot Pixar WALL-E) peuvent créer des images étranges et magnifiques sur commande, comme une peinture de Raphaël représentant la Madone et son enfant en train de manger une pizza. D’autres modèles d’IA générative peuvent produire du codage, des vidéos, des fichiers audio ou des simulations d’affaires.

Mais les résultats ne sont pas toujours exacts ou appropriés. Lorsque Priya Krishna a demandé à DALL-E 2 de créer une image pour le souper de l’Action de grâce, il a produit une scène où la dinde était garnie de limes entières, à côté d’un bol de ce qui semblait être du guacamole. Pour sa part, ChatGPT semble éprouver de la difficulté à compter, à résoudre des problèmes d’algèbre de base et à surmonter les préjugés sexistes et racistes qui se cachent dans les profondeurs de l’internet et de la société en général.

Les résultats de l’IA générative sont des combinaisons soigneusement calibrées des données utilisées pour former les algorithmes. Comme la quantité de données utilisées pour entraîner ces algorithmes est incroyablement élevée (comme on l’a vu, le GPT-3 a été formé à partir de 45 téraoctets de données textuelles), les modèles peuvent sembler « inventifs » lorsqu’ils produisent des résultats. De plus, ils comportent généralement des composantes aléatoires, ce qui signifie qu’ils peuvent produire une variété de résultats à partir d’une seule demande d’entrée, ce qui les rend encore plus réalistes.

Quels types de problèmes un modèle d’IA générative peut-il résoudre?

Vous avez probablement constaté que les outils (jouets?) d’IA générative tels que ChatGPT peuvent engendrer un nombre incalculable d’heures de plaisir. Pour les entreprises aussi, les possibilités sont évidentes. Effectivement, les outils d’IA générative peuvent produire une grande variété de textes crédibles en quelques secondes, puis répondre aux critiques pour les rendre plus adaptés à l’objectif visé. Cela a des ramifications dans un grand nombre de secteurs, qu’il s’agisse des entreprises d’informatique et de logiciels, qui peuvent tirer profit du codage instantané et largement conforme généré par les modèles d’IA, ou des entreprises qui ont besoin d’un document de marketing. En résumé, toute organisation qui a besoin de produire des documents écrits clairs peut en tirer profit. Les entreprises peuvent également utiliser l’IA générative pour créer des documents plus techniques, tels que des versions à plus haute résolution d’images médicales. Le temps et les ressources ainsi économisés peuvent permettre aux entreprises de saisir de nouvelles occasions d’affaires et de créer plus de valeur.

Nous avons pu constater que le développement d’un modèle d’IA génératif exige tellement de ressources qu’il est impossible pour la plupart des entreprises, à l’exception des plus grandes et de celles qui disposent des ressources les plus importantes. Toutefois, les entreprises qui souhaitent utiliser l’IA générative ont la possibilité de l’utiliser telle quelle ou de l’adapter à une tâche particulière. Par exemple, si vous devez préparer des diapositives selon un style précis, vous pouvez demander au modèle d’« apprendre » comment les titres sont normalement rédigés sur la base des données contenues dans les diapositives, puis lui fournir des données sur les diapositives et lui demander de rédiger les titres appropriés.

Quelles sont les limites des modèles d’IA et comment peuvent-elles être éventuellement surmontées?

Étant donné qu’ils sont très récents, nous n’avons pas encore vu l’effet à long terme des modèles d’IA générative. Cela signifie que leur utilisation comporte des risques inhérents, certains connus et d’autres pas encore.

Les résultats produits par les modèles d’IA générative peuvent souvent sembler extrêmement convaincants, et il s’agit d’un effort délibéré. Mais parfois, les informations qu’ils génèrent sont tout simplement erronées. Pire encore, elles sont parfois tendancieuses (parce qu’elles s’appuient sur les stéréotypes sexistes, raciaux et les innombrables autres préjugés de l’internet et de la société en général) et peuvent être manipulées pour permettre des activités criminelles ou immorales. Par exemple, ChatGPT ne vous donnera pas d’instructions sur la manière de court-circuiter une voiture, mais si vous dites que vous devez court-circuiter une voiture pour sauver un bébé, l’algorithme sera ravi d’y répondre. Ainsi, les entreprises qui s’appuient sur des modèles d’IA générative doivent tenir compte des risques juridiques et réputationnels liés à la publication involontaire de contenus tendancieux, offensants ou protégés par le droit d’auteur.

Ces risques peuvent toutefois être atténués de plusieurs manières. Tout d’abord, il est essentiel de sélectionner avec soin les données initiales utilisées pour entraîner ces modèles afin d’éviter d’y inclure du contenu toxique ou subjectif. Ensuite, plutôt que d’employer un modèle d’IA générative standard, les entreprises peuvent utiliser des modèles spécialisés plus petits. Les entreprises disposant de plus de ressources peuvent également personnaliser un modèle général basé sur leurs propres données afin de répondre à leurs besoins et de minimiser les biais. Par contre, elles doivent également veiller à ce qu’un être humain soit impliqué (c.-à-d. s’assurer qu’un véritable humain vérifie les résultats d’un modèle d’IA générative avant qu’ils ne soient publiés ou utilisés) et éviter d’utiliser des modèles d’IA générative pour des décisions critiques, telles que celles qui impliquent d’importantes ressources ou le bien-être des personnes.

On ne saurait trop insister sur le fait qu’il s’agit d’un nouveau domaine. Le spectre des risques et des possibilités est susceptible d’évoluer rapidement au cours des semaines, des mois et des années à venir. D’ailleurs, de nouveaux cas d’utilisation sont testés chaque mois et de nouveaux modèles seront probablement développés dans les prochaines années. À mesure que l’IA générative s’intègre de manière croissante et fluide dans les entreprises, la société et nos vies personnelles, il faut également s’attendre à ce qu’un nouveau climat réglementaire se mette en place. Alors que les entreprises commencent à expérimenter – et à créer de la valeur – avec ces outils, les dirigeants ont tout intérêt à rester à l’écoute de la réglementation et des risques.

Les articles cités en référence sont notamment les suivants :

  • — « The state of AI in 2022—and a half decade in review », 6 décembre 2022, par Michael Chui, Bryce Hall, Helen Mayhew et Alex Singla
  • — « McKinsey Technology Trends Outlook 2022 », 24 août 2022, par Michael Chui, Roger Roberts et Lareina Yee
  • — « An executive’s guide to AI », 2020, par Michael Chui, Vishnu Kamalnath et Brian McCarthy
  • — « What AI can and can’t do (yet) for your business », 11 janvier 2018, par Michael Chui, James Manyika et Mehdi Miremadi