Le mode voix avancé de ChatGPT est déployé avec une nouvelle interface utilisateur et plus de voix

Le mode voix avancé de ChatGPT est déployé avec une nouvelle interface utilisateur et plus de voix

Le monde des jeux vidéo évolue constamment, et avec les avancées technologiques, des outils très innovants voient le jour. Dans cet article, nous allons explorer la toute nouvelle fonctionnalité du ChatGPT, à savoir le mode voix avancé, qui offre une nouvelle interface utilisateur et prend en charge plusieurs voix. Préparez-vous à découvrir comment cette mise à jour va transformer vos interactions avec l’intelligence artificielle !

Qu’est-ce que le ChatGPT Advanced Voice ?

Après plusieurs mois d’attente, OpenAI déploie enfin le ChatGPT Advanced Voice pour les utilisateurs Plus et Team. Ce déploiement sera complété d’ici la fin de la semaine. Le mode voix avancé est alimenté par le modèle multimodal GPT-4o, permettant une conversation fluide avec prise en charge des interruptions.

Bien que l’entrée par caméra ne soit pas encore disponible, OpenAI prévoit d’ajouter plus de modalités à l’avenir. Lors de son annonce, le mode voix avancé avait été présenté durant le lancement du GPT-4o, mais des reports ont eu lieu en raison de problèmes de sécurité, ainsi qu’une controverse autour de la voix « Sky », qui ressemblait beaucoup à celle de Scarlett Johansson.

Les avantages du mode voix avancé

Le mode Advanced Voice représente une mise à niveau significative par rapport au chat vocal standard disponible pour les utilisateurs gratuits de ChatGPT. En exploitant les capacités multimodales du modèle GPT-4o, il permet une conversation naturelle et fluide, bien plus engageante.

À la différence de Gemini Live de Google, qui utilise des moteurs TTS/STT (text-to-speech) pour extraire des réponses d’un LLM, le mode Advanced Voice de ChatGPT supporte les entrées et sorties audio directement. Malgré des fonctionnalités similaires, Gemini Live ne parvient pas à offrir une véritable expérience multimodale.

Limitations et attentes futures

Bien que ChatGPT Advanced Voice soit prometteur, il a perdu certaines fonctionnalités multimodales lors de mes tests. La démonstration initiale montrait que l’intelligence artificielle pouvait chanter, identifier les émotions à partir de la voix, détecter différents sons et même imiter des accents. Cependant, l’Advanced Voice affirme actuellement qu’il ne peut pas identifier la parole, et l’entrée par caméra reste absente.

Il semble qu’OpenAI ait retiré certaines fonctionnalités pour éviter des conversations embarrassantes avec ChatGPT. Néanmoins, les utilisateurs sont-ils prêts à essayer cette nouvelle version du ChatGPT ?

Conclusion

Le déploiement du ChatGPT Advanced Voice est un pas en avant dans l’évolution de l’interaction homme-machine. Bien qu’il puisse comporter des limitations pour le moment, les perspectives d’avenir et les mises à jour attendues promettent d’enrichir cette expérience. Êtes-vous excités à l’idée de discuter avec un ChatGPT plus interactif ? Partagez vos pensées dans les commentaires ci-dessous !

Autres tutoriaux qui peuvent vous intéresser