Déchiffrer les émotions faciales, traduire instantanément des vidéos dans n'importe quelle langue, ou encore manier l'ironie dans une discussion : telles sont les nouvelles capacités de GPT-4o, la dernière version du modèle d'intelligence artificielle générative présentée par OpenAI le 13 mai. Cette mise à jour transforme ChatGPT en un assistant vocal ultra-sophistiqué. Voici un aperçu des trois nouvelles fonctionnalités impressionnantes de cette IA.
Lire Aussi
Le modèle GPT-4o (« o » pour « omni ») permet à ChatGPT de comprendre le texte, le son et les images, et de répondre de manière écrite, vocale ou visuelle. Ces améliorations seront progressivement intégrées à ChatGPT. Les utilisateurs payants seront les premiers à bénéficier des nouvelles capacités de traitement du texte et des images, suivis par les utilisateurs gratuits avec certaines limitations. La version améliorée du mode vocal, qui permet des conversations réalistes, sera disponible dans les semaines à venir pour les abonnés.
Des interactions plus humaines
Lors d'une démonstration en direct, ChatGPT a montré sa capacité à lire les émotions des utilisateurs via la caméra d'un smartphone, guider des exercices de respiration, raconter des histoires et résoudre des problèmes mathématiques.
"Oh arrête, tu me fais rougir," a répondu ChatGPT après que l'un des ingénieurs d'OpenAI lui a dit qu'il montrait au public à quel point elle était "utile et fabuleuse."
Des attentes et des réalités
Le vendredi précédant l'annonce, Sam Altman, PDG d'OpenAI, avait nié les rumeurs concernant les nouvelles fonctionnalités, affirmant sur X (ex-Twitter) qu'il ne s'agissait ni de GPT-5 ni d'un moteur de recherche. Il avait toutefois ajouté que les nouveautés à venir seraient très appréciées : "Pour moi, c’est comme de la magie".
Altman a exprimé son admiration pour le film de science-fiction "Her", où un homme développe une relation amoureuse avec une IA à travers des conversations vocales, le qualifiant de "prophétique" et source d'inspiration pour l'idée d'un agent personnalisé pour chacun.
Des réactions mitigées
Les experts du secteur ont réagi de manière diverse à cette mise à jour. Jeff Boudier de Hugging Face a souligné que les démonstrations donnaient une image trop humaine des modèles, ce qui pourrait engendrer de la confusion et des attentes irréalistes.
Depuis sa création en tant que laboratoire de recherche à but non lucratif, OpenAI a vu sa valeur grimper à environ 80 milliards de dollars lors d'une vente de titres en février, selon le New York Times. Le Financial Times a rapporté que les revenus annuels de l'entreprise atteignaient environ 2 milliards de dollars depuis décembre 2023.
Cette évolution de GPT-4o marque un tournant significatif pour ChatGPT, élargissant ses capacités et ouvrant de nouvelles possibilités pour les interactions homme-machine.