Meta lanza una inteligencia artificial para traducir voz a texto en más de 100 idiomas

Tecnología
Publicado el 22/08/2023 a las 21h23
ESCUCHA LA NOTICIA

Meta presentó su próximo modelo de traducción de voz a texto, que será compatible con casi 100 idiomas, llamado SeamlessM4T. Esta tecnología busca minimizar las limitaciones lingüísticas y permitir el entendimiento simultáneo.

Este sistema también permitirá la tradición de texto a texto y de voz a voz, con una capacidad de reconocer 100 idiomas de entrada y generar resultados en 35 más de salida.

El lanzamiento de este modelo está enfocado en los desarrolladores, ya que esta licencia permite a los expertos colaborar y mejorar el modelo, allanando el camino para futuras innovaciones, por lo que por ahora no se trata de un producto de consumo para los usuarios.

Las novedades del modelo multilenguaje

Una característica notable que distingue a SeamlessM4T es su capacidad para identificar el code-switching, que es un fenómeno lingüístico en el que los hablantes cambian entre dos o más idiomas en una sola oración.

Esta característica es especialmente desafiante para los sistemas de inteligencia artificial, y la inclusión de esta posibilidad es un punto diferente frente a los sistemas actuales del mercado. Para demostrarlo, Meta informó que ya ha sido capaz de diferenciar entre hindi, telugu e inglés en una única oración, lo que promete una mayor exactitud en la traducción en situaciones del mundo real.

A diferencia de modelos de traducción anteriores, que dividían el proceso de traducción entre sistemas variados, SeamlessM4T realiza la tarea completa de traducción en un solo paso, lo que representa un avance en la eficiencia y precisión en el entendimiento automático y en tiempo real.

Otro elemento a destacar en el desarrollo de este modelo es su capacidad para identificar palabras tóxicas o sensibles, que según la compañía son aquellas que incitan al odio, la violencia, la profanidad o el abuso. De esta forma garantizan que la traducción no introduzca toxicidad que no estaba presente en el material original.

“Filtramos la toxicidad desequilibrada en los datos de entrenamiento. Si la entrada o la salida contenían cantidades diferentes de toxicidad, eliminábamos esa secuencia de aprendizaje”, publicó la compañía en su anunció.

Además, el equipo de investigación de Meta ha trabajado para mitigar el sesgo de género en las traducciones. SeamlessM4T es capaz de identificar y cuantificar este sesgo, asegurando que las traducciones sean equitativas y no introduzcan conceptos innecesarios.

Por ejemplo, el sistema es capaz de detectar si la persona dijo ‘doctora’ en español y de esa forma asignar un pronombre femenino en un idioma distinto sin una gramática de género equivalente si es necesario, ya que algunas lenguas no tienen en su estructura una distinción de género marcada, como el caso del inglés.

El lanzamiento de este nuevo modelo hace parte de los proyectos que viene mostrando la empresa en el campo de la inteligencia artificial. Hace un tiempo, la compañía presentó modelos y conjuntos de datos como No Language Left Behind y SpeechMatrix, que también permiten la traducción automática.

Estas últimas herramientas también han sido claves en la moderación eficiente del contenido en plataformas como Facebook e Instagram, donde se realizan publicaciones en grandes cantidades idiomas de idiomas.

Otro sistema de IA que ha mostrado Meta recientemente son AudioCraft, que es un código que permite la generación de texto a sonido y que también solo está disponible para desarrolladores. Sumado al acceso a su modelo de lenguaje más grande llamado Llama 2.

Tus comentarios




En Portada
Abogados voluntarios, entre exmagistrados y exfiscales, además de organizaciones sociales leales al expresidente y jefe del Movimiento Al Socialismo (MAS),...
Conozca en dos minutos las noticias más importantes de esta jornada.

La Sala Penal Primera de Santa Cruz revocó este martes las medidas sustitutivas a favor de Guillermo Parada dentro del caso "ítems fantasma", por lo que deberá...
Ante los incendios que se registran en los alrededores de la represa de Corani, en el municipio de Colomi, afectando a la ceja de monte en el ingreso al Parque...
El fiscal de Materia Ricardo Caballero ordenó la "aprehensión" del propietario de la constructora Las Loritas, Harold Lora, investigado por el delito de...
En una operación coordinada, el viceministro de Régimen Interior y Policía, Johnny Aguilera, la tarde de este martes se llevaron a cabo tres allanamientos en...

Actualidad
Los bomberos voluntarios que combaten los incendios en los alrededores de la represa de Corani, en el municipio de...
El gobernador Humberto Sánchez se ausenta del país del 23 al 25 de agosto para participar de una reunión de...
Ante los incendios que se registran en los alrededores de la represa de Corani, en el municipio de Colomi, afectando a...
El Centro de Salud Rojas Mejía en coordinación con la Secretaria de Salud del Gobierno Autónomo Municipal de Cochabamba...

Deportes
El enfrentamiento entre Bolívar e Internacional en los cuartos de final de la Copa Libertadores resultó en una derrota...
Padres de familia de las categorías sub-7 y sub-8 de Wilstermann denunciaron este martes que los jugadores que...
Miguel Terceros, Enzo Monteiro y Fernando Nava son los primeros legionarios que llegaron al país rumbo al partido...
El Ministerio de Trabajo dispuso de manera excepcional tolerancia en la jornada laboral de este martes, a partir de las...

Tendencias
Este 23 de agosto, la ciudad de Cochabamba recibe el cubo que recorre Bolivia en el marco del desafío “La Llave Mi Tigo...
Meta ya tiene lista la versión web de Threads, la aplicación asociada a Instagram y que compite directamente con X,...
Meta presentó su próximo modelo de traducción de voz a texto, que será compatible con casi 100 idiomas, llamado...
Caminando por la Vida es una campaña de solidaridad en la que participan personas, empresas y organizaciones, jóvenes...

Doble Click
La exmiss La Paz, Adriana Salazar denunció a través de su cuenta de TikTok que fue agredida por un sujeto, el pasado...
Un total de 14 espectáculos artísticos figuran en la cartelera de festejos por la conmemoración de 159 años de...
La Biblioteca Gabriel García Márquez, ubicada en la ciudad española de Barcelona (noreste), fue declarada ayer Mejor...
La orquesta municipal San José Patriarca abre el Festival de Música Misional y Teatro en Chiquitos, que comienza este...