Vous avez sûrement entendu parler de ChatGPT, le phénomène de l’intelligence artificielle qui a envahi la toile ces dernières semaines ! Le 30 novembre 2022, l’entreprise californienne OpenAI, connue pour promouvoir et développer des solutions d’intelligence artificielle, lançait une nouvelle itération de son système GPT-3.5, leur IA basée sur le traitement du langage naturel, en dévoilant au grand public son nouveau prototype de chatbot appelé « ChatGPT ». Des millions d'utilisateurs ont pu essayer l’IA conversationnelle avec un succès tel que les serveurs de l'éditeur n'ont par moment pas tenu ! Mais qu’est-ce qui se cache derrière “ChatGPT” ?
- ChatGPT : histoire et contexte de la technologie d’OpenAI
- ChatGPT, une révolution dans le monde de la relation client ?
- Comment utiliser ChatGPT ?
- Quelles sont les limites de ChatGPT ?
ChatGPT : histoire et contexte de la technologie d’OpenAI
Qu'est-ce que ChatGPT ?
ChatGPT est un prototype de chatbot d’intelligence artificielle capable de comprendre le langage humain naturel et de générer un dialogue textuel d’un niveau de détail inégalé. Il s’agit d’un robot conversationnel reposant sur la technologie GPT-3, une IA basée sur le traitement du langage naturel entraînée avec 175 milliards de paramètres.
Il s’agit de la dernière implémentation de la famille GPT (Generative Pre-Trained Transformer), l’intelligence artificielle générative de texte créée par l’entreprise californienne OpenAI. Après avoir enrichi leur meilleur modèle de langage GPT-3 avec des capacités lui permettant de comprendre des instructions et des consignes en langage naturel (ce qui a donné un modèle intermédiaire moins médiatisé appelé InstructGPT, sorti en janvier 2022) OpenAI a, de nouveau, ajouté une couche supplémentaire de spécialisation à son IA pour lui apprendre les codes d’une conversation entre humains, et l’a doté d’une interface conviviale pour le rendre accessible à tous.
D’ailleurs, que signifie le GPT de ChatGPT ?
- “G” pour “Generative” : il s’agit d’un modèle génératif, c’est-à-dire un modèle d’apprentissage automatique qui va générer un contenu comme du texte ou des images.
- “P” pour “Pre-Trained” : soit une notion de pré-entraînement, c’est-à-dire, le fait que le modèle a acquis, grâce aux “exemples” (les données) qu’il a étudiés, une certaine connaissance de leur contenu et de leurs règles de constitution.
Par exemple, pour des textes, il aura appris des représentations permettant de capturer des relations comme des règles d'orthographe, de grammaire, etc. Mais il aura aussi mémorisé les personnes/objets ou histoires qu’ils contiennent. Comme il s’agit d’apprentissage automatique, tout est modélisé au travers de statistiques et de probabilités.
- “T” pour “Transformers” : c’est le nom de l’architecture neuronale profonde (Deep Learning) proposée par Google en 2017 et qui a révolutionné le domaine du Traitement Automatique de la Langue Naturelle (NLP /Natural Language Processing). Cette architecture complexe a permis une forte amélioration de la modélisation de la langue, en offrant une meilleure prise en compte des interactions entre les mots et leur contexte.
Schématiquement, ces modèles “génératifs” sont essentiellement des modèles qui sont capables de générer (prédire) le mot d’après (le plus probable) d’après les mots précédents (c’est à dire en suivant un contexte). L’architecture sous-jacente permettra de faire en sorte que ces prédictions soient les meilleures possibles avec la meilleure prise en compte de la séquence précédente.
Ainsi, le modèle sous-jacent GPT-3 est à catégoriser comme un LLM (« Large Language Model »), c’est-à-dire un modèle d’apprentissage automatique de modélisation de la langue qui a été entraîné au préalable sur un volume incommensurable de données.
ChatGPT-3 est capable de modéliser la langue et d’effectuer des travaux relevant du Traitement Automatique de la Langue Naturelle (NLP /Natural Language Processing). L’autre grande force de ce type de modèles à grande échelle est qu’ils sont des candidats idéaux pour effectuer ce qui relève de l’apprentissage par transfert (Transfer Learning), c’est-à-dire le fait d’utiliser des compétences et connaissances acquises par un modèle pour réaliser une tâche pour laquelle il n’a pas été prévu à l’origine.
Cette approche est particulièrement intéressante puisqu’elle permet de spécialiser un modèle à des domaines ou tâches spécifiques en bénéficiant de ses connaissances apprises sur un domaine plus général. Il faut cependant noter que ChatGPT-3, grâce à sa grande taille, semble nativement capable de réaliser certaines de ces tâches spécifiques même sans cette procédure d’adaptation, tout comme il a appris de lui-même à être multilingue de par la quantité des données qu’il a étudiées.
Qu’est-ce qui différencie ChatGPT des versions précédentes de GPT ?
Comme cela a été expliqué, à l’origine, l’IA GPT est une IA générative qui a appris à écrire du contenu textuel en considérant tous les codes de la langue naturelle (orthographe, syntaxe, grammaire, etc.) même si elle le fait mot à mot. Elle a appris l’ensemble de ces règles via l’analyse statistique de milliards d’exemples, ce qui la rend capable de continuer une phrase ou bien de raconter des histoires. Elle sait ainsi rédiger du contenu.
Pour ChatGPT, OpenAI a ajouté différentes couches : plusieurs relevant de “l’apprentissage par renforcement avec retours humains” (Reinforcement Learning with Human Feedback, RLHF), ce qui a permis d’améliorer le comportement de l’IA en lui dictant via des retours d’évaluateurs humains comment ils voudraient qu’elle se comporte.
Cela a permis de mettre en évidence qu’il était préférable d’être courtois, d’ajouter des formules de politesse, de proposer des réponses qui reprennent une partie de la question ou des réponses longues, etc. Ainsi, ChatGPT a appris de ses interactions avec des évaluateurs à mieux mémoriser les codes d’un dialogue humain sympathique et bienveillant.
Et c’est l’un des autres sujets sur lequel OpenAI travaille en particulier. En effet, OpenAI avait fait ingurgiter à ChatGPT-3 des milliards de données (environ 499 milliards de mots), issues de contenus disponibles sur web, pouvant provenir aussi bien de sites d’informations, que de plates-formes encyclopédiques comme Wikipédia, ou encore le contenu de livres de la littérature.
Sauf qu’à l’ère des fake news et de la désinformation, l’IA pouvait se nourrir de contenu faux, inapproprié voire même dangereux et ressortir ce contenu dans ses conversations, ne sachant pas distinguer le vrai du faux.
Pour pallier ce problème de taille, les chercheurs d’OpenAI ont ajouté dans la version actuelle, et en particulier pour ChatGPT, plusieurs couches supplémentaires de contrôle à la fois via un autre modèle d’apprentissage automatique dédié à détecter les contenus malveillants/offensants, mais aussi via ce procédé de RLHF avec ses évaluateurs humains pour surveiller les sujets qu’il est possible d’aborder et de la manière dont il est possible d’en parler.
Et c’est justement cette combinaison, entre algorithmes et intervention humaine, qui a donné toute la puissance de l’outil ChatGPT, focalisé sur le conversationnel. Grâce à un travail de prédiction et d'entraînement par des humains à différents niveaux, l’IA arrive à tenir un dialogue aisément, de manière polie, et à être disert tout en demandant des précisions et du contexte à son interlocuteur si elle en a besoin et parfois même à dire “je ne sais pas” si elle ne peut pas apporter de réponse (même si cela est probablement plus un artefact de son apprentissage, que la réalité de sa compréhension de “ne pas savoir”, l’IA ne sait pas qu’elle ne sait pas, elle ne fait qu’exprimer qu’elle ne sait pas). En bref, on lui a appris à être une IA agréable avec qui on peut discuter de manière fluide sur tous les sujets possibles et imaginables.
OpenAI : e schéma des apprentissages par renforcement avec des retours humains dans la boucle (RLHF)
Et concrètement, comment marche ChatGPT ?
Il suffit simplement d’écrire à l’IA via une interface de saisie, comme si on s’adressait à un interlocuteur humain, en lui posant une question ou en lui soumettant une requête, et l’intelligence artificielle va générer instantanément une réponse. Ainsi, ce prototype de chatbot est capable de tenir une conversation avec un humain de façon bluffante et s'entraîne au fur et à mesure des conversations.
D’ailleurs, les milliers d'utilisateurs qui ont utilisé le système ces derniers jours, ont déjà mis à l’épreuve le prototype et l’ont donc fortement entraîné au passage. En revanche, la connaissance historique de ChatGPT s’arrête, pour le moment, à juin 2021.
D’autres sociétés de la Tech travaillent à incorporer une connexion avec Internet sur ce genre de modèle pour assurer une fraîcheur des données et ne pas être obsolètes. Le challenge sera alors de ne pas laisser le modèle se perdre pour apprendre (ou recopier) depuis des sources de données non acceptables (fake news).
On pourrait supposer qu'OpenAI prévoit alors de faire également de son côté une telle interconnexion afin d’avoir un outil qui pourra générer des textes basés sur des informations fraîches et actualisées.
Qui est OpenAI, l’entreprise derrière ChatGPT ?
OpenAI est une entreprise à « but lucratif plafonnée » (depuis 2019) en intelligence artificielle, basée à San Francisco. Son objectif est de promouvoir et de “développer une intelligence artificielle à visage humain qui bénéficierait à toute l'humanité”. En développant ses propres projets, ou en cherchant à s’associer avec des start-ups utilisant l'intelligence artificielle, OpenAI a pour but d’avoir un effet transformateur dans des domaines tels que la santé, le changement climatique et l'éducation ou la productivité.
L’IA créée par la société est déclinée en différentes initiatives comme DALL-E pour la génération d’images à partir de texte et InstructsGPT puis ChatGPT pour leur prototype de chatbot capable de créer un échange de manière naturelle sur n’importe quel sujet.
Il est utile de rappeler qu’OpenAI était aussi l’un des pionniers de l'apprentissage par renforcement, c’est-à-dire la branche de l’apprentissage automatique qui permet d’intégrer dans les algorithmes d’IA des boucles de rétroaction et de contrôle via des concepts de pénalités/récompenses. Cette approche permet également d’enrichir les modèles avec des évaluations réalisées par des humains.
Aussi il est probable que ChatGPT soit également un moyen d’améliorer à la fois la qualité de la génération, mais aussi d’enrichir encore plus rapidement ses capacités conversationnelles, notamment grâce aux dialogues réalisés et collectés (les données seraient l’or de ce siècle). Enfin, il est probable également que l’entreprise californienne utilisera cette expérience pour améliorer l’aspect “helpful/honest/harmless” qu’elle met également en avant afin d’éviter la génération de fake news ou de contenus inappropriés.
ChatGPT, une révolution dans le monde de la relation client grâce à l’IA ?
Aujourd’hui, ChatGPT est capable de fournir des descriptions, des réponses et des solutions à des requêtes complexes. Les applications possibles pour cette IA sont donc nombreuses. En relation client, ce genre de modèle peut fournir par exemple une aide précieuse à la rédaction et améliorer les interactions des chatbots en les rendant encore plus “humains” dans leur manière de converser.
Aide à la génération de texte
En relation client, écrire les contenus des FAQ dynamiques ou des scénarios de chatbot est un véritable travail qui demande de prendre en compte un certain nombre de paramètres : informations, SEO, clarté de l’explication, mise en forme des réponses… Avec toute sa connaissance, l’IA de GPT-3 peut faire gagner un temps considérable dans la rédaction des contenus.
Demandons par exemple à ChatGPT de rédiger un modèle de réponse de FAQ pour la question “Comment lire les informations de mon RIB ?” Une réponse, mise en forme et optimisée, est générée instantanément. Un vrai gain de temps !
Aide à la mise en forme de texte
De la même manière, si le texte est déjà écrit, ChatGPT peut le mettre en forme instantanément en un simple clic. Une fonctionnalité très intéressante lorsque le texte comprend des informations spécifiques liées à l’entreprise ou au secteur d’activité.
Aide à la recherche d’informations
Comment expliquer un concept de manière simple et compréhensible ? Parfois, cette tâche peut s’avérer complexe et chronophage. Grâce à la connaissance acquise par l’IA de ChatGPT, une réponse peut être générée automatiquement, prête à être publiée. Par exemple, à la question “qu’est ce qu’une authentification à double facteur ?”, ChatGPT apporte une réponse claire et complète.
Aide à la traduction
Traduire des contenus peut être un exercice chronophage et périlleux en relation client. A-t-on besoin d’un traducteur ? En combien de temps, les contenus peuvent-ils être traduits ? En demandant à ChatGPT de traduire un contenu en le mettant en forme, cela pourrait apporter un gain de temps considérable !
Comment utiliser ChatGPT ?
Tester ChatGPT est un jeu d’enfant ! Il suffit de créer un compte sur la page dédiée d’OpenAI en renseignant :
- votre adresse e-mail et en la validant
- votre nom et prénom
- votre numéro de mobile
Un code vous sera envoyé pour finaliser votre inscription. Vous devrez ensuite indiquer à quelles fins vous souhaitez utiliser les outils OpenAI. Pour une utilisation personnelle, cliquez sur « I’m exploring personal use ».
Pour utiliser ChatGPT, rendez-vous sur le site depuis un navigateur web. Toutes vos conversations avec le prototype de chatbot serviront bien évidemment à son entraînement. L’interface utilisateur se présente comme une simple fenêtre de messagerie instantanée. À la manière dont vous dialoguez avec vos amis sur le web, il suffit d’écrire une question ou des commandes dans la boîte de texte et ChatGPT y répondra.
Vous pouvez utiliser ChatGPT gratuitement. L'outil est accessible seulement sur navigateur web du type Chrome, Safari ou Firefox (sur desktop ou sur mobile). La version actuelle n’est pas connectée à internet. Ses réponses proviennent uniquement de la dernière version de ses données, ce modèle ayant été entraîné avec un historique qui s’arrête en juin 2021. La version 4 de ChatGPT est quant à elle payante.
Quelles sont les limites de ChatGPT ?
C’est indéniable, les performances de ChatGPT sont impressionnantes ! Mais à l’heure actuelle, le prototype reste limité et perfectible. D’ailleurs, il est présenté comme une version d’étude par le CEO d’OpenAI lui-même.
Voici quelques limites du prototype :
Droits et plagiats
Premier constat, la problématique de droits et de plagiats des contenus persiste encore et toujours. Il y avait déjà une controverse concernant le code informatique dans le cadre de Github Copilot selon laquelle GPT-3 redistribuait des parties de code sans en indiquer la source. Avec le nombre incalculable de contenus analysés et intégrés par ChatGPT (et par DALL-E pour les images) provenant de milliers de sources sur Internet, on se retrouve également devant un problème de droits d’auteur des sources utilisées.
De plus, selon le niveau de reformulation de l’IA, il est possible que ChatGPT réponde avec du contenu plagié, ce qui peut poser problème lors de la réutilisation des réponses (dans le cadre d’un devoir d’étudiant par exemple, ou lors de l’écriture d’un article).
Réponses incorrectes ou absurdes
Il lui arrive d’écrire des réponses incorrectes ou absurdes bien qu’elles puissent sembler véridiques. Il s’agit d’hallucinations de l’IA. Prenons l’exemple d’un lycéen, pour qui ChatGPT peut être une source infinie de devoirs rédigés facilement grâce à un simple énoncé. Si l’IA a la capacité de rédiger le devoir en quelques secondes, elle n’est pas dotée de discernement et pourra disserter en employant un raisonnement potentiellement faux.
Autre exemple avec une requête concernant une suite de nombres à continuer. Bien qu'elle ait lu des contenus ressemblant à des additions et qu'elle soit capable de "recopier" ces raisonnements, elle peut donner des résultats complètement faux.
Dans ce cas, 88 ne sera jamais égal à 4*3 + 1…
De la même manière, lors de requêtes avec un très gros volume de textes générés en une seule fois, l’IA peut aussi perdre le fil du contexte de ce qu’elle raconte et partir sur quelque chose de complètement fantasque. Par exemple, cela peut poser problème dans le cadre de la génération d’un texte dans un but médical. Si celui-ci est faux, les conséquences peuvent être considérables pour le patient et donc affecter l’humain. OpenAI planche justement sur la question pour réduire le taux d’hallucinations du robot.
ChatGPT pourra également être prudent et ne pas apporter de réponse. En revanche, il pourra aussi affirmer ne pas connaître la réponse à une question, mais y répondre correctement après un léger changement de formulation.
Interprétation des requêtes
De plus, lorsque la requête peut sembler ambiguë, ChatGPT va avoir tendance à interpréter et deviner et non demander des précisions à son interlocuteur, ce qui pourra provoquer des erreurs de compréhension ou donner de fausses réponses.
Suroptimisation et réponses fleuves
Autre problème, le robot aura tendance à être excessivement prolixe et à apporter des réponses longues, voire trop longues, dans un souci de compréhension. Un problème dû à une suroptimisation lors de l’entraînement et au fait que les évaluateurs humains, qui sont intervenus lors de sa mise au point, eussent tendance à préférer les réponses longues et étayées.
Manque d’actualisation de la connaissance
On l’a dit plus tôt, mais sa base de connaissance actuelle s’arrête à juin 2021. Ses réponses ne tiennent donc pas compte des faits postérieurs à cette date. Son contenu peut donc être faux et obsolète.
Fake news et désinformation
Si générer du texte à un haut niveau de précision est une chose qui semble acquise, ChatGPT est encore loin de pouvoir remplacer un humain dans la rédaction de contenus journalistiques. En effet, l’IA n’a pas le niveau de nuance, d’esprit critique et d’éthique requis. Il est également encore capable de présenter des éléments de désinformation en guise de faits.
Elle ne sait réellement pas déduire des faits comme des chaînes logiques et son comportement est donc assimilable à celui d'un perroquet qui répète ce qu’il a entendu. L’API Moderation est utilisée pour bloquer certains types de contenus, mais des faux négatifs et faux positifs demeurent. OpenAI compte sur le feedback des utilisateurs pour régler ce problème.
Instructions ou comportements dangereux
Enfin, malgré les efforts d’OpenAI pour que le modèle refuse les requêtes inappropriées, le filtre n’est pas infaillible. ChatGPT peut quelques fois réagir à des instructions dangereuses ou faire preuve d’un comportement biaisé.
Si la fureur ChatGPT des dernières semaines semble annoncer une révolution dans le domaine de l’intelligence artificielle, la technologie existe pourtant depuis un moment et OpenAI (et ses concurrents…) travaillent à son amélioration pour développer et contrôler toute sa puissance.
Si aujourd’hui le prototype de chatbot ChatGPT met en évidence les limites actuelles du modèle d’apprentissage automatique de modélisation de la langue, cela laisse tout de même présager de nombreuses améliorations à venir prochainement grâce à l’entraînement de l’IA et à la résolution des problèmes et de belles perspectives d’évolution dans la relation client.