Darius Baruo
19 déc. 2025 02h12
Together AI annonce l'intégration des modèles Rime Arcana v2 et Mist v2 pour améliorer les capacités de synthèse vocale, offrant une expressivité améliorée et un contrôle de la prononciation pour les applications d'entreprise.
Together AI a introduit deux modèles avancés de synthèse vocale (TTS) Rime, Arcana v2 et Mist v2, dans sa plateforme, améliorant ses offres AI Native Cloud. Ces modèles, comme l'a rapporté Together AI, visent à fournir des solutions vocales de niveau entreprise avec une expressivité améliorée et une précision de prononciation.
Avancées dans la technologie TTS
Arcana v2 et Mist v2 sont conçus pour s'intégrer de manière transparente avec les modèles de langage de grande taille (LLM) existants et les systèmes de reconnaissance vocale (STT), permettant aux utilisateurs de gérer leur infrastructure technologique vocale plus efficacement. Les modèles sont hébergés sur l'infrastructure cloud computing dédiée de Together AI, garantissant une faible latence et une haute fiabilité essentielles pour les applications d'entreprise.
Arcana v2 : Expressivité conversationnelle améliorée
Arcana v2 est conçu pour l'expressivité, offrant plus de 40 voix dans plusieurs langues et dialectes pour répondre à divers scénarios de service client. Il est particulièrement efficace dans les environnements nécessitant des capacités conversationnelles nuancées, telles que les ventes et le support, où il a montré une amélioration de mesures telles que le taux de conversion des ventes et les taux de réussite des appels.
Mist v2 : Précision dans la prononciation
Mist v2 se concentre sur la prononciation déterministe, essentielle pour les applications à volume élevé où la cohérence est critique. Ce modèle permet aux utilisateurs de définir la prononciation une fois, garantissant l'uniformité sur différentes voix et plateformes. Une telle précision est cruciale dans des secteurs comme la santé et la finance, où une communication précise est vitale.
Impact sur les applications d'entreprise
Les deux modèles sont déjà déployés dans diverses industries, des entreprises du Fortune 500 aux startups. La capacité d'Arcana v2 à améliorer l'interaction conversationnelle a conduit à des améliorations significatives de l'engagement client. Pendant ce temps, la fiabilité de Mist v2 dans le contrôle de la prononciation prend en charge des environnements à enjeux élevés tels que le service client et les systèmes de réponse vocale interactive (IVR).
Infrastructure et conformité
Together AI fournit une infrastructure robuste prenant en charge ces modèles, avec des ressources GPU dédiées et la conformité aux normes SOC 2 Type II et HIPAA. Cette configuration garantit que les entreprises peuvent déployer des solutions vocales qui répondent à des exigences réglementaires strictes tout en maintenant des performances élevées et une disponibilité.
Perspectives futures
Avec l'intégration de ces modèles, Together AI continue de faire progresser sa plateforme, offrant une suite complète de solutions vocales qui répondent aux besoins variés des entreprises. Ce développement marque une étape importante dans l'évolution des technologies vocales pilotées par l'IA, promettant des interactions plus naturelles et efficaces dans les systèmes automatisés.
Source de l'image : Shutterstock
Source : https://blockchain.news/news/together-ai-integrates-rime-voice-models-enhanced-tts-solutions


