OPENAI lance une nouvelle version de ChatGPT, GPT-4o !

Article publié le 14 mai 2024

Un bond technologique

OpenAI a dévoilé ce lundi GPT-4o, une nouvelle version de ChatGPT, désormais capable de mener des conversations orales fluides avec ses utilisateurs. Ce lancement n’est pas anodin, il intervient juste avant les annonces prévues par Google, accentuant la compétition féroce dans le domaine de l’IA générative. GPT-4o intègre une compréhension avancée du texte, du son et des images, et peut répondre par écrit, par voix ou encore en générant des images. Les premières démonstrations sont impressionnante de par leur sophistication. François Cazals, professeur adjoint à HEC et expert en stratégies digitales, souligne que cette évolution marque un pas vers une IA vocale et multimodale de haut niveau, avec une latence d’échange de seulement 0,3 seconde, c’est à dire comparable à une conversation humaine. Nicolas Gaudemet, directeur exécutif en charge de l’IA chez Onepoint Consulting, ajoute que GPT-4o traite désormais les sons non verbaux et les émotions de manière plus naturelle et spontanée, un progrès significatif par rapport aux versions précédentes qui se limitaient à la transcription textuelle.

Des usages élargis et une stratégie affirmée

Une vidéo en direct a démontré les capacités de GPT-4o à détecter les émotions sur les visages via une caméra de smartphone, à guider des exercices de respiration, à raconter des histoires et à résoudre des problèmes mathématiques, avec une facilité d’interruption par les utilisateurs. Cette avancée vocale ouvre la voie à de nouveaux usages tels que la traduction en temps réel et le service client, avec une capacité de compréhension des nuances et des émotions suffisante pour remplacer les chatbots ou même certaines hot-lines humaines. Ce lancement stratégique, à la veille de la conférence Google I/O 2024, montre la volonté d’OpenAI, soutenue par Microsoft, d’occuper le terrain et d’accélérer l’adoption de ses produits. Selon François Cazals, OpenAI anticipe les risques de se faire surpasser par Google dans le domaine des grands modèles de langage destinés au grand public. Pour la première fois, GPT-4o unifiera les versions précédentes (GPT-3.5 gratuit et GPT-4 payant) sous un seul modèle, avec des mises à jour pour les abonnés ChatGPT+ et Team, incluant bientôt un mode vocal amélioré, ainsi qu’une analyse vidéo en temps réel.

Voici deux démonstrations des capacités de traduction de ChatGPT 4o : https://x.com/L_ThinkTank/status/1790142640886780132 ou encore : https://vimeo.com/945586717

DIVA, c’est quoi ?

En Pays de la Loire, l’EDIH DIVA est un collectif d’experts du numérique, de l’innovation et du développement économique qui œuvre pour permettre aux entreprises ligériennes d’accélérer leur transformation digitale tout en développant des usages utiles et éthiques de la donnée par les entreprises.

Vous vous questionnez sur les sujets de la DATA et de l’IA ? Vous vous demandez si ces sujets vous concernent ? Vous souhaitez vous faire accompagner dans votre projet ?

Ce site utilise des cookies et vous donne le contrôle sur ce que vous souhaitez activer