SELECCIONAR IDIOMA:

La traducción automática en la traducción

hoja de referencia


Después de casi 80 años de historia, la traducción automática pasa por un buen momento.

 

En los últimos años, a medida que todos los aspectos de la inteligencia artificial se han ido consolidando en el espíritu de nuestra era, la «traducción automática neuronal» ha surgido como una de tantas palabras de moda que captan la atención en todos los sectores. No importa cuál sea su relación con el concepto de traducción automática (TA), debe saber cómo hablar sobre ella.

A medida que las aplicaciones de inteligencia artificial se van haciendo más accesibles para empresas y consumidores, surge un nuevo léxico de términos. Si usted fuese un observador externo, ¿cómo analizaría la diferencia entre los términos que a veces se usan indistintamente?

¿Cómo traduce el término «machine translation»?

Estamos aquí para ayudarle. En Lionbridge, contamos con algunos de los expertos en TA con más experiencia del mundo y hemos trabajado con ellos para desarrollar esta hoja de referencia para ayudarle a conocer las sutiles diferencias (y las que no lo son tanto) de los términos que hacen que el sector siga avanzando.

1. Inteligencia artificial

Para comprender las tendencias actuales en TA, primero debe familiarizarse con el escenario en que han surgido: una poderosa y atractiva inteligencia artificial. La IA es el tipo de «inteligencia» que demuestran las máquinas cuando realizan tareas que requieren una forma de pensamiento propiamente humano, como el aprendizaje y la resolución de problemas. En los últimos años, la IA se ha beneficiado del aumento de la potencia de los ordenadores. Los ordenadores más potentes no solo ofrecen un procesamiento más intenso durante una tarea, sino también un aprendizaje automático, que es la forma en que los ordenadores adquieren los conocimientos necesarios para las aplicaciones de IA, más avanzado.

2. Aprendizaje automático

El aprendizaje automático es una rama de la informática que utiliza cantidades masivas de datos para enseñar a los ordenadores a realizar tareas. El aprendizaje automático examina datos relacionados con una determinada tarea, encuentra patrones en esos datos y establece asociaciones entre ellos, y luego utiliza esos nuevos conocimientos para dar forma al modo en que el ordenador realiza la tarea. Si después de dicho análisis, el ordenador mejora en la realización de la tarea, entonces se ha producido un aprendizaje automático.

Como disponemos de datos sobre todo lo que quepa imaginar, se utiliza el aprendizaje automático para mejorar el rendimiento de los ordenadores en todos los campos, desde el pronóstico del tiempo hasta la selección automática de acciones de bolsa, pasando por la traducción automática.

Female standing holding a laptop

3. Traducción automática

En pocas palabras, la traducción automática es una traducción realizada por una máquina: se introduce un material en el idioma original en un ordenador y este lo devuelve en otro idioma. No es perfecta, pero es una de las herramientas más potentes con las que contamos para obtener traducciones de gran calidad de forma más eficaz.

En las últimas décadas, la TA ha mejorado muchísimo en lo que se refiere a la calidad de sus resultados y la variedad de idiomas que admite. Desde los sistemas de sustitución de una sola palabra en los inicios de la TA hasta los léxicos y gramáticas de TA basada en normas explícitamente codificadas, pasando por un paradigma de cálculos de la TA estadística o el aprendizaje profundo y las redes neuronales de la TA neuronal, el desarrollo de la TA refleja el uso cada vez más sofisticado de los ordenadores.

4. Traducción automática estadística

La traducción automática estadística aprovecha el aprendizaje automático para generar una gran cantidad de posibles traducciones para una determinada frase; luego, selecciona la mejor opción, basándose en la probabilidad de que las palabras y frases aparezcan juntas en el idioma de destino. La traducción automática estadística aprende de la traducción a través del prisma de los «engramas» (pequeñas agrupaciones de palabras que aparecen juntas en el idioma de origen y en el idioma de destino). Durante las fases de aprendizaje automático, se proporciona material de aprendizaje al sistema de traducción automática estadística: es decir, muchísimos ejemplos de oraciones en la lengua de origen y sus traducciones en la lengua de destino. El algoritmo de aprendizaje divide las oraciones de origen y las de destino en engramas y determina qué engramas del idioma de destino es probable que aparezcan en una traducción cuando un determinado engrama del idoma de origen aparece en la oración.

A continuación, el algoritmo de aprendizaje crea un modelo lingüístico que calcula la probabilidad de que determinadas palabras o frases aparezcan unas junto a otras en el idioma de destino. Cuando se consigue el aprendizaje y llega el momento de traducir material nuevo, el sistema de traducción automática estadística divide la nueva oración original en engramas, busca los engramas del idioma de destino con un porcentaje más alto de coincidencia y empieza a generar posibles traducciones. La traducción final será esa frase cuyos engramas del idioma de destino se corresponden con un mayor porcentaje de coincidencia con los engramas de la frase original y cuyas palabras del idioma de destino tienen mayor probabilidad de aparecer juntas en este.

La traducción automática estadística funciona sorprendentemente bien, en especial si se tiene en cuenta que no hay nada de carácter lingüístico en un sistema de traducción automática estadística; de hecho, el sistema solamente toma en consideración los engramas, nunca una frase completa. Esto difiere de un enfoque novedoso de la TA: la traducción automática neuronal.

5. Traducción automática neuronal

La traducción automática neuronal supera el gran defecto de la traducción automática estadística: su dependencia del análisis de engramas. La traducción automática neuronal otorga poder a la máquina; el sistema recibe el material de aprendizaje, al igual que ocurriría en la traducción automática estadística, pero existe una diferencia clave: una vez que el sistema recibe el material, decide por sí solo cómo aprender todo lo posible sobre esa información.

Los sistemas de traducción automática neuronal crean vectores de información para cada frase de origen, asociando así la información de cada palabra con las palabras que la rodean. Algunos sistemas ofrecen cientos de datos por cada palabra, lo cual genera una mayor precisión. Con el aprendizaje profundo, los sistemas de traducción automática neuronal captan una gran cantidad de información de cada palabra y frase de origen; luego, utilizan lo que se denomina un modelo de atención para perfeccionar las características más importantes que se han aprendido a través del análisis de estos flujos masivos de datos y que son importantes para el proceso de traducción. El resultado son traducciones que muestran una notable mejora en la fluidez, lo que significa que las traducciones creadas por ordenador empiezan a sonar cada vez más naturales.

Aunque la traducción automática neuronal sigue siendo un paradigma de la TA muy nuevo, supone un punto de inflexión en nuestro sector. A medida que mejoran y se consolidan las herramientas disponibles, en Lionbridge seguimos aumentando el uso de TA para acelerar nuestros procesos de producción.

 

En Lionbridge, hablamos con fluidez el idioma de la TA. Cada año ampliamos y mejoramos los servicios de TA y posedición que ofrecemos desde el año 2002. Descubra aquí como utilizamos nuestra experiencia en TA para ayudar a nuestros clientes.

Hable de sus necesidades de traducción automática con nuestro equipo.

 

#IA #localización #TA #traducción #traducción automática

linkedin sharing button
  • #blog_posts
  • #translation_localization

Lionbridge
AUTHOR
Lionbridge