À ce stade, OpenAI semble inarrêtable.
Voilà moins d’un an que ChatGPT a envahi le web et nos vies, et le service n’a pas manqué de s’améliorer avec le temps. Aujourd’hui, OpenAI, société mère du chatbot permettant de dialoguer textuellement avec les IA LLM (Large Language Models) GPT-3.5 et GPT-4, annonce fièrement de nouvelles fonctionnalités au potentiel certain.
Avec cette nouvelle version du service, il sera possible de parler avec ChatGPT… et de l’entendre vous répondre. Bref, de la reconnaissance et de la synthèse vocales. Il vous sera possible de lui poser des questions en direct ou encore de lui demander de vous raconter une histoire, cela grâce à une nouvelle technologie permettant à ChatGPT de générer une voix artificielle à partir d’extraits de voix humaine. Comme avec Siri ou Google Assistant, mais en version LLM et probablement bien plus pertinente.
La voix dans ChatGPT
ChatGPT acceptera aussi que vous lui envoyez des images. Que vous ayez besoin d’aide pour détecter la pièce endommagée d’un appareil électronique fonctionnant mal, pour analyser un graphique complexe ou pour improviser un repas avec les ingrédients de votre frigo, l’IA saura à présent répondre à vos requêtes. Cette fonctionnalité pourra également être utilisée par les personnes malvoyantes pour leur venir en aide dans leur vie quotidienne, une utilisation perfectionnée par Open AI après avoir collaboré avec Be My Eyes, une application mobile pour personnes non et mal voyantes.
La reconnaissance d’images dans ChatGPT
OpenAi a décidé de partager ses nouvelles technologies avec ses clients ChatGPT Plus et Entreprise dans les deux prochaines semaines. Les autres publics attendront, bien que les développeurs devraient suivre prochainement.
La synthèse vocale ne servira qu’au chat, et ne devrait pas permettre de créer des deep fakes comme expliqué dans l’annonce de l’entreprise. D’autres applications pourront néanmoins s’en servir, comme par exemple Spotify, qui traduit maintenant des podcasts dans d’autres langues.
Ces nouveautés seront déployées uniquement via les app mobiles de ChatGPT dans un premier temps.