Meta développe un système d’IA qui traduit en temps réel 100 langues

Meta vient de développer un nouveau modèle d’intelligence artificielle capable de traduire et transcrire près de 100 langues dans le texte et la parole impliquant plusieurs dialectes.

Une avancée significative dans la synthèse vocale basées sur l’IA

Baptisée SeamlessM4T, cette I.A propose un ensemble de données de traduction «SeamlessAlign » également disponible en mode open source. Selon Meta, SeamlessM4T constitue une avancée significative dans le domaine de la synthèse vocale basées sur l’IA.
« Notre modèle unique propose des traductions à la demande qui aident les personnes parlant des langues différentes à communiquer plus efficacement » a indiqué la société sur son blog.

 Les langues sources sont implicitement reconnues par SeamlessM4T sans nécessiter un mécanisme d’identification de langue.
À certains égards, SeamlessM4T est l’héritier spirituel d’Universal Speech Translator, l’un des seuls systèmes de traduction parole-parole en direct.
De plus, l’architecture de Meta a été développée pour une parole massivement multilingue, qui offre une technologie de synthèse vocale, d’identification et de reconnaissance des langues dans plus de 1 100 langues.
Meta n’est pas le seul à consacrer des efforts à la création de systèmes de transcription et de traduction d’IA de pointe.

Un modèle qui comprend  les 1 000 langues les plus parlées au monde

Dans le cadre des efforts plus vastes de Google visant à développer un modèle capable de comprendre les 1 000 langues les plus parlées au monde, le géant de la technologie développe de son côté, ce qu’il appelle le modèle vocal universel, qui va au-delà de la richesse des services commerciaux et des modèles open source déjà disponibles. Entre-temps, Mozilla a dirigé le développement de Common Voice, l’une des collections de voix les plus complètes en plusieurs langues pour l’enseignement des systèmes de reconnaissance vocale automatique.
Cependant, SeamlessM4T est l’une des tentatives les plus audacieuses à ce jour pour intégrer les capacités de traduction et de transcription dans un modèle unique.
Selon Meta, SeamlessM4T a surpassé le modèle de transcription vocale le plus récent dans les tâches de synthèse vocale.

Articles récents

Les plus lus

A lire également