SELECCIONAR IDIOMA:

Finger points to circular rings

Uso de la terminología para mejorar la traducción automática

Gracias a la aplicación de una excelente gestión terminológica, podrá mejorar la calidad de los resultados de la traducción automática

A medida que los profesionales y el público general utilizan cada vez más sistemas de traducción automática (TA) genéricos y gratuitos, es fundamental saber que las traducciones generadas con estos motores no son perfectas. Y una mala calidad o la presencia de errores catastróficos pueden perjudicar a las empresas. Sin embargo, existen distintas formas de mejorar la calidad de la TA, por ejemplo, mediante una gestión eficaz de la terminología de la TA.

¿Qué reto plantea la terminología para la traducción automática?

La terminología sigue representando uno de los mayores retos para la traducción automática debido a las complejas asociaciones que existen entre los conceptos y sus representaciones mediante unidades terminológicas.

Desde el punto de vista terminológico, el uso de sistemas de TA gratuitos en determinados ámbitos puede generar resultados no deseados, lo cual puede repercutir muy negativamente, por ejemplo, en los ámbitos médico y jurídico.

Aunque es posible entrenar los sistemas de TA con corpus de ámbitos específicos para evitar, hasta cierto punto, unos malos resultados, los sistemas de TA genéricos no garantizan el uso de una terminología coherente y precisa.

La calidad de una traducción generada por un motor de TA depende, entre otras cosas, de la calidad del corpus bilingüe que se haya empleado para el entrenamiento. Por lo tanto, solo es posible obtener una traducción exacta de la terminología si el corpus incluye los términos pertinentes tanto en el idioma de origen como en el de destino.

Aunque los sistemas de traducción automática neuronal (NMT) se basan en distribuciones probabilísticas de términos, son esenciales pero también insuficientes para garantizar traducciones de alta calidad. La frecuencia de aparición de los términos en el corpus debe ser la adecuada para que el descodificador obtenga las equivalencias exactas. Si la frecuencia de un término en concreto no es la adecuada, no tendrá el peso suficiente como para que se lo considere un candidato para las equivalencias y su traducción será imprecisa.

Una mano se acerca a una esfera que contiene fotos de personas

¿Por qué el entrenamiento de sistemas de TA genéricos genera traducciones erróneas?

Los sistemas de TA genéricos suelen entrenarse con corpus extensos de contenido muy diverso. Por consiguiente, es posible que el término candidato más frecuente y su posible equivalente pertenezcan a un ámbito distinto al del término que se está traduciendo y, de este modo, puede que los términos no se traduzcan con precisión al idioma de destino.

Por ejemplo, el término en español fósforo puede traducirse al inglés como match (si nos referimos a la cerilla) o como phosphorus (o si nos referimos a su acepción como elemento químico). Un motor de TA genérico no podrá diferenciar la intención fácilmente, por lo que la traducción probablemente será incorrecta.

¿Y cómo se puede solucionar este problema? Entrenando sistemas de TA personalizados con textos bilingües específicos de un ámbito en concreto que incluyan terminología especializada.

Aun así, si la terminología no se emplea de forma coherente, no se podrá garantizar la precisión de las traducciones cuando se entrenen los motores con textos especializados.

¿Qué soluciones ofrece el mercado?

Las investigaciones en este ámbito proponen introducir información lingüística en los sistemas de traducción automática neuronal (NMT) mediante métodos de anotación.

La implementación de anotaciones manuales o semiautomáticas dependerá de los recursos disponibles, como los glosarios, y de las limitaciones, como el tiempo, el coste y la disponibilidad de los anotadores humanos.

¿Qué soluciones ofrece Lionbridge?

La herramienta Smairt MT™ de Lionbridge permite aplicar reglas lingüísticas en el texto de origen y de destino, así como reforzar la terminología a partir de listas de términos no traducibles (DNT) y de glosarios que se añaden a un perfil específico.

Ayudamos a nuestros clientes a crear y mantener los glosarios, que se actualizan con frecuencia para incluir nuevos términos que resulten pertinentes y retirar aquellos que estén obsoletos. Los glosarios creados en Smairt MT pueden utilizarse en todos los motores de TA, lo que supone un ahorro de tiempo y dinero.

¿Cómo puede sacar el máximo partido de los glosarios en proyectos de TA?

El uso de glosarios en proyectos de TA no es tan sencillo como parece, ya que, si estos recursos no se utilizan bien, pueden repercutir de manera negativa en la calidad global de la traducción automática. La mejor forma de ceñirse a la terminología en la TA es mediante el entrenamiento de este tipo de sistemas.

La combinación de motores de TA entrenados, los glosarios personalizados y la identificación de reglas de preprocesamiento y posprocesamiento permiten garantizar que los resultados de la TA contengan la terminología adecuada y que presenten un estilo similar al de la documentación del cliente.

Puntos y cubos tridimensionales sobre un fondo oscuro

¿Qué funciones de gestión terminológica debería incorporar una solución de traducción automática?

Al evaluar las funciones de gestión terminológica en una solución de traducción automática, asegúrese de que permitan lo siguiente:

  • Gestionar glosarios
  • Gestionar listas de términos no traducibles (DNT)
  • Gestionar las traducciones sugeridas y aprobadas
  • Cargar términos y frases de forma masiva mediante la importación de glosarios y memorias de traducción (TM)
  • Crear perfiles de motores de TA específicos para cada ámbito o producto y automatizar el enrutamiento de contenido entre esos motores

Si se combinan, todas estas prestaciones generarán traducciones de mayor calidad.

¿Cómo funciona la solución Smairt MT de Lionbridge?

Smairt MT incorpora varios sistemas de TA externos a través de un conector. Se trata de una especie de "herramienta central" para la traducción automática que permite:

  • Conectarse a los principales proveedores externos de TA, como Microsoft, Google, Amazon, DeepL y Yandex.
  • Gestionar la terminología: permite agregar y actualizar términos del glosario o no traducibles sobre la marcha para conservar la terminología y garantizar su precisión en los resultados.
  • Aplicar reglas lingüísticas que permitan a los usuarios modificar el texto de origen o el resultado de la TA para resolver los problemas conocidos y mejorar su calidad.

Lionbridge también dispone de otras automatizaciones que permiten identificar incoherencias entre la terminología de los glosarios de los clientes y la forma en la que se aplica esa terminología en el corpus empleado para el entrenamiento de la TA y en los resultados. Estas automatizaciones ayudan a detectar los casos en los que el corpus de entrenamiento o, posteriormente, los resultados de la TA no se ajustan a la terminología aprobada y los corrigen.

Si la TA no incluye la terminología necesaria, es recomendable recurrir a un glosario que incluya los términos no traducibles, los nombres de productos y la terminología clave de los ámbitos específicos o la de la marca.

¿Qué otros consejos se pueden seguir a la hora de crear y utilizar glosarios?

Para garantizar la obtención del resultado deseado en la traducción automática, le recomendamos que consulte estas guías cuando vaya a crear sus glosarios:

  • Incluya en los glosarios únicamente aquellos términos que puedan utilizarse de forma sistemática en todos los casos en los que aparezca el término de origen, lo que suele ser aplicable a la terminología especializada, al vocabulario aprobado por el cliente y a los términos técnicos.
  • Si hay varias traducciones para un solo término de origen, añada una sola línea de traducción en el glosario.
  • Utilice sobre todo sintagmas nominales. Esta opción es recomendable en el caso de los términos formados por varias palabras, términos específicos del sector o nombres de productos propios del cliente.
  • Evite el uso de términos generales o más habituales, ya que, cuando hay muchas entradas terminológicas en una sola frase, la calidad de la traducción puede verse afectada.

Contacte con nosotros

Si desea obtener más información sobre cómo Lionbridge puede ayudarle a gestionar la terminología y sacar el máximo partido de la TA, póngase en contacto con nosotros hoy mismo.

linkedin sharing button

Yolanda Martin y Janette Mandell
AUTORAS
Yolanda Martin y Janette Mandell
  • #technology
  • #blog_posts
  • #translation_localization