Si OpenAI capte l’attention ces derniers jours non pas sur ses innovations, mais sur ses changements ou … non-changements de direction, nous avons souhaité revenir sur les dernières innovations.
L’essor spectaculaire de l’intelligence artificielle a été synonyme d’une année novatrice pour notre quotidien. Désignée "word of the year" par les dictionnaires Collins, l’IA a encore franchi une nouvelle étape avec les annonces de Sam Altman, CEO d’OpenAI.
OpenAI organisait donc son 1er Dev Day le 6 novembre avec la volonté de redevenir le leader de l’IA générative, et présentait ses dernières technologies.
L'objectif de ces innovations est d'élargir notre palette de connaissances, de contribuer de manière significative à l'optimisation de notre temps et, par transitivité, d'augmenter notre productivité. Si, dans le passé, l'IA a souvent été perçue comme une menace destructrice pour l'emploi, les dernières études comme celles de McKinsey ou de l’ONU révèlent au contraire qu’elle est plus génératrice qu'il n'y paraît.
Dans cet article, Smart Tribune vous fait découvrir les nouvelles annonces d’OpenAI et l’avenir autour de nos usages. On décortique pour vous le potentiel de ces nouveautés et l’impact de celles-ci sur nos métiers.
OpenAI Dev Day : les points essentiels de cette conférence
GPT-4 Turbo : une nouvelle version plus puissante de GPT-4
Sam Altman, PDG d’OpenAI, a présenté une nouvelle déclinaison pour son GPT-4, deux fois plus rapide, et plus puissante encore que sa version antérieure : GPT-4 Turbo. Performances à l’honneur, GPT 4-Turbo apparaît comme l’un des modèles (versus Bard, Anthropic, etc.) les plus performants pour répondre aux besoins des utilisateurs en misant sur une meilleure fluidité d'interaction, et en proposant une plus large palette de fonctionnalités.
GPT-4 Turbo exploite désormais une plus large fenêtre contextuelle avec la possibilité de prendre en charge jusqu’à 128 000 tokens pour ses requêtes, soit 300 pages de prompts textuels, repoussant ainsi son ancienne limite de 32 000 tokens.
Pour rappel, un token représente 3 à 4 lettres en texte anglais. On peut donc estimer les 128 000 tokens à environ 96 000 mots, que GPT-4 Turbo peut assimiler comme contexte et mémoriser en même temps.
Autre point important sur cette nouvelle version, la mise à jour de son corpus de connaissances et son historique étendus désormais à avril 2023. L’ancienne version voyait sa mémoire bridée à septembre 2021, réduisant ainsi les possibilités créatrices.
L’API de GPT-4 Turbo connaît également son lot de changements puisque le coût d'exécution s’en retrouve très réduit ; GPT-4 Turbo coûte moins cher à exécuter que GPT-4 pour un coût de 0,01 $ pour 1000 tokens en entrée (input), soit les instructions du prompt. Les tokens produits en sortie de génération (output) ne sont pas épargnés non plus, puisque leur coût est réduit de moitié soit 0,03 $ pour 1000 tokens.
Le système exploite de nouvelles capacités marquant la première API multimodale d’OpenAI.
GPT-4 Turbo avec Vision
GPT-4 Turbo génère des légendes et des analyses détaillées des images grâce à Vision. Le système est capable de comprendre et de décrire des formes et des figures dans les documents qui lui sont transmis.
Nous avons réalisé des tests, et Vision a été capable de déchiffrer et analyser des schémas fonctionnels de pompes à chaleur, et d’identifier des problèmes potentiels comme savoir si certaines vannes étaient fermées. Bluffant !
DALL-E 3 dans l’API
DALL-E 3 est désormais accessible via l'API, offrant la possibilité de générer des images et des visuels à partir de descriptions textuelles. Cette mise à jour de DALL-E inclut une modération conçue pour assister les développeurs dans la protection de leurs applications contre d'éventuels abus. Les coûts débutent à 0,04 $ par image générée.
Synthèse vocale avec Text-To-Speech (TTS)
La synthèse vocale offre aux développeurs la capacité de générer une parole d'une qualité humaine à partir de texte. Le modèle Text-To-Speech propose six voix prédéfinies. Le coût commence à 0,015 $ par tranche de 1 000 caractères.
GPT Builder
Une grande nouveauté pour les utilisateurs, OpenAI propose désormais de créer sa propre IA personnalisée. Que vous souhaitiez en faire un usage professionnel ou personnel, il vous est possible de modéliser votre chatbot customisé en apportant les ressources nécessaires à sa programmation dans un outil nommé GPT Builder.
"GPTs" pour un GPT Store
Ces chatbots personnalisés sont appelés "GPTs", et pourront être proposés sur une plateforme commerciale, le GPT Store. Il sera possible d’accéder à cette plateforme afin de télécharger les "GPTs" d’autres utilisateurs et créateurs.
Sans évoquer de plus grandes précisions, Sam Altman a mentionné le fait que les créateurs de ces "GPTs" percevraient une rémunération partielle ; une récompense pour les créateurs de "GPTs" les plus téléchargés et utilisés du GPT Store.
Ces mini outils présentent évidemment de nombreuses limites telles que le nombre de documents capables d’être ingurgités, mais également le fait que tout le code du bot soit … totalement publique et récupérable par quiconque !
OpenAI explore ici le développement d’un nouveau business model en adoptant une approche similaire à celle des magasins d'applications présents dans les écosystèmes Apple ou Android.
Copyright Shield : un bouclier pour la propriété intellectuelle
L’expansion de l’IA générative a entraîné de nombreuses problématiques, notamment juridiques autour de la propriété intellectuelle. En cas d'inquiétude concernant l'utilisation de certains contenus, OpenAI prend en charge l'intégralité des coûts associés grâce à Copyright Shield. OpenAI souhaite protéger les entreprises et ses clients API, et s’engage à couvrir leurs frais de poursuites judiciaires liés à la violation des droits d’auteurs.
Sam Altman en a également profité pour rappeler qu’OpenAI n’utilise pas les données de ses clients payants pour incorporer et entraîner leurs connaissances dans ses modèles.
Comment ces innovations IA impactent-elles nos usages ?
Si l’IA générative révolutionnait déjà une grande partie de nos usages, ces dernières annonces promettent un nouveau tournant dans nos habitudes de consommation.
OpenAI impose ChatGPT comme le meilleur outil conversationnel multimodal, et compte bien distancer ses concurrents en déployant un arsenal complet d’outils génératifs pour réinventer les usages de ses utilisateurs.
Les développeurs peuvent désormais appréhender les choses sous un angle plus vaste, étendant ainsi la capacité à gérer des documents plus denses, mais surtout profiter des fonctionnalités multimodales avec la description et la compréhension de l’image, et les possibilités liées à la voix.
L'IA générative contribue à l’évolution de nos pratiques professionnelles en repoussant la créativité et en optimisant les processus, notamment dans la conception et la génération. Cette technologie personnalise nos expériences en ligne, rendant nos interactions plus fluides. Les nouveautés proposées par OpenAI signent sans doute une nouvelle ère des chatbots. Une ère d’automatisation, et une meilleure gestion de l'information.
Cependant, son émergence nous interroge quant à ses limites dans nos usages. ChatGPT est remarquable d’efficacité en matière de génération de contenu, néanmoins le risque d’hallucinations dans les réponses qui sont générées nous incite à considérer la véracité de l’information dégagée par ces outils. Les données qui nous sont projetées nécessitent une analyse rigoureuse, un œil attentif et expert afin d’éviter la propagation d’informations faussées.
L’IA générative soulève également des questions éthiques cruciales, telles que la protection de la vie privée. Il est impératif d'encadrer son développement pour garantir un impact positif et éthique et que les politiques accélèrent son encadrement. L'IA générative présente des possibilités convaincantes, mais exige une réflexion approfondie sur ses implications sociales, mais également personnelles et politiques.
En fin de compte, bien que l'IA générative offre des opportunités passionnantes, il est essentiel de la superviser, et de la considérer comme un outil complémentaire plutôt que comme une solution totalement autonome. En tant qu’être humain, notre vigilance et notre discernement constituent nos atouts indispensables pour garantir l’exactitude et la pertinence de l’information générée.
Nous suivons ces innovations de très près chez Smart Tribune pour vous offrir la meilleure version de nos outils, et ainsi vous permettre d’atteindre plus rapidement et efficacement vos objectifs.
Vous souhaitez étoffer vos connaissances en matière d’IA générative ? Restez connectés pour ne rien rater des dernières actualités en suivant notre veille hebdomadaire de l’IA générative sur notre LinkedIn, ou consultez notre veille IA en ligne sur notre blog.