TECNOLOGIA

Meta anunció SeamlessM4T, un modelo multilingüe de traducción y transcripción con IA

por El Nacional El Nacional

Tras la impresionante acogida de ChaGPT, Meta se ha afanado por presentar y lanzar sus más avanzados sistemas de inteligencia artificial, los cuales, vale la pena mencionar, llevan largos años de desarrollo y no se crean de la noche a la mañana.

A principios de mes, la compañía anunció Audio Craft, una plataforma de IA generativa de audio a partir de texto que podría transformar la industria de la música y el trabajo de los productores. En esta ocasión, Meta ha presentado SeamlessM4T, un modelo de IA multimodal de traducciones de voz y texto.

Si hay algo evidente desde la llegada de internet, es la globalización que permite, entre otras cosas, conectarse con millones de personas de todo el mundo. En este sentido, la comunicación es parte fundamental teniendo en cuenta que son muchos los idiomas que se hablan alrededor del planeta.

Meta apuesta por la traducción impulsada por IA

Según la compañía, SeamlessM4T es el primer modelo de traducción de IA multimodal y multilingüe todo en uno. Su principal ventaja es que permitirá a las personas que hablan diferentes idiomas comunicarse sin esfuerzo gracias a su traducción en tiempo real de cerca de 100 idiomas, ya sea a través del habla o mediante texto.

Las opciones de traducción son bastantes, con opciones de traducir de voz a voz, voz a texto, texto a texto e incluso de texto a voz. La compañía espera construir un traductor universal de idiomas rápido, simple y preciso, y este es el primer paso para ir en busca de ese objetivo.

Características principales de la IA SeamlessM4T 

Una de las características más especiales de este modelo de IA, es que puede detectar cambios de idioma por parte de la fuente que está hablando y continuar con la traducción sin que esto afecte, algo que sin duda es  bastante avanzado desde el punto de vista tecnológico.

SeamlessM4T se suma a una larga lista de sistemas desarrollados por Meta para la traducción de idiomas. De hecho, está basado en desarrollos de años anteriores No Language Left Behind (NLLB), un modelo de traducción automática de texto a texto con soporte para 200 idiomas que es usado por Wikipedia; Universal Speech Translator, el primer sistema de traducción directa de voz a voz para Hokkien, un idioma sin un sistema de escritura ampliamente utilizado; y Massively Multilingual Speech, que proporciona reconocimiento de voz, identificación de idiomas y tecnología de síntesis de voz en más de 1.100 idiomas.

De momento, Meta no lanzará un traductor online con esta tecnología. En su lugar, la compañía lanzará su modelo de IA bajo la licencia CC BY-NC 4.0, lo que en teoría da vía libre a cualquier persona, empresa u organización para utilizarlo de forma pública y gratuita para cualquier fin, aunque no se podrá comercializar ningún producto derivado de esta tecnología.

Por Sergio Ramos, editor en Social Geek, y contribuidor en Entrepreneur y Forbes en Español. Experto en temas de tecnología que disfruta aprendiendo sobre startups, emprendimiento e innovación.