Traduzione automatica neurale: modalità di funzionamento dell'intelligenza artificiale per la traduzione linguistica

Ultimo Aggiornamento: 17/02/2017 17.43

Come la maggior parte dei professionisti del marketing sa, l'enorme crescita dei volumi di Big Data ha rivoluzionato il modo in cui le aziende operano, alla continua ricerca di nuovi livelli di efficienza e innovazione. E questo è solo l'inizio. Gli esperti stimano che i volumi di dati continueranno ad aumentare del 40% anno dopo anno.

Naturalmente, nella ricerca di modi efficaci per utilizzare i dati, le aziende si trovano ad affrontare sfide legate al sovraccarico di informazioni. I Big Data offrono tuttavia anche grandi opportunità, tra cui la possibilità di internazionalizzare un'azienda attraverso la localizzazione.

Oltre all'enorme aumento dei dati, ci sono altri due fattori che stanno contribuendo ai cambiamenti nel settore della localizzazione. In primo luogo, la crescita esponenziale della potenza dei computer e, in secondo luogo, un interesse sempre maggiore per il cosiddetto apprendimento profondo, o deep learning: un tipo di apprendimento automatico usato da Google negli algoritmi di riconoscimento delle immagini e della voce.

Considerando questi fattori, non sorprende che l'apprendimento automatico sia stato di recente alla base di una rivoluzione nel settore della traduzione e della localizzazione, con la nascita della traduzione automatica neurale (NMT, Neural Machine Translation). Dopotutto, con l'aumento dei volumi di dati e i progressi nella tecnologia, aumentano anche i materiali traducibili. Ma cos'è esattamente la traduzione automatica neurale e in che modo aumenta l'efficienza della localizzazione?

In un recente webinar, Jay Marciano, Director of Machine Translation presso Lionbridge ha discusso dell'applicazione di questo metodo di traduzione nuovo e più accurato e dei progressi che ne conseguono nel settore.

Come funziona la traduzione automatica neurale

La traduzione automatica neurale è una metodologia relativamente nuova, introdotta per la prima volta verso la fine del 2014. Prima di allora, la traduzione automatica funzionava usando un modello statistico basato su apprendimento automatico tramite un database di traduzioni precedenti, dette memorie di traduzione.

La traduzione automatica neurale dipende dal training in base alle memorie di traduzione come la traduzione automatica statistica, ma usa anche l'apprendimento profondo e un volume maggiore di dati di training per costruire una rete neurale artificiale.

Marciano usa come esempio una partita a scacchi per illustrare il funzionamento della traduzione automatica statistica. In un programma di scacchi c'è un numero limitato di mosse possibili. Il programma calcola semplicemente tutte le mosse possibili per trovare quella migliore. Analogamente, l'apprendimento automatico che avviene in un sistema di traduzione automatica statistica funziona confrontando n-grammi, o raggruppamenti di sei parole, in una frase di origine con le opzioni nella lingua di destinazione per trovare correlazioni.

La traduzione automatica neurale può invece essere descritta come l'atto di "allevare" un sistema neurale, come spiega Marciano. È come suonare il pianoforte: quando si commette un errore, si torna indietro e si riprova fino a ottenere il risultato desiderato. Allo stesso modo, i sistemi di traduzione automatica neurale cercano di trovare il giusto percorso attraverso le reti neurali.

Da questo punto di vista, la traduzione automatica neurale è molto più efficace del modello limitato, e spesso impreciso, basato su n-grammi. Per prima cosa, i sistemi di traduzione automatica neurale funzionano con potenti GPU (unità di elaborazione grafica) anziché con CPU (unità di elaborazione centrale) come fanno invece i sistemi di traduzione automatica statistica. E sebbene la traduzione automatica neurale richieda più tempo per tradurre una frase in quanto utilizza un grosso volume di dati (come anche i sistemi di traduzione automatica statistica impiegano molto più tempo rispetto ai vecchi sistemi basati su regole), la traduzione automatica statistica presenta grossi problemi con le lingue in cui le regole si applicano al di fuori dell'unità di sei parole.

Naturalmente, anche la traduzione automatica neurale presenta alcuni problemi, ad esempio nella traduzione di contenuti estremamente tecnici. Ma il materiale di origine contenente abbreviazioni tecniche sconosciute non verrebbe tradotto bene da nessun sistema di traduzione automatica, inclusa quella neurale. Per le combinazioni linguistiche per le quali non sono disponibili molti dati di training, ad esempio dal tedesco al coreano, l'apprendimento profondo offre la possibilità di usare dati di training indiretti, ricavati dal materiale di origine di un'altra lingua.

Qual è la principale differenza tra traduzione automatica neurale e traduzione automatica statistica? Quando si presenta il materiale di training agli algoritmi di apprendimento profondo, non si indica necessariamente cosa cercare. Si lascia che il sistema trovi da solo i modelli, ad esempio gli indizi contestuali in relazione alla frase di origine. Le specifiche del processo, tuttavia, rimangono misteriose sotto molti aspetti.

Traduzione automatica neurale e Big Data: potenzialità illimitate

Le reti neurali sono state usate per la prima volta nei programmi di riconoscimento vocale e di immagini, da sistemi di training con dati scelti appositamente, ad esempio l'immagine di un cane con metadati allegati. Leggendo i metadati, il sistema sa che deve identificare il contenuto dell'immagine come un cane.

Cerca quindi di trovare il percorso migliore attraverso la rete neurale per creare quel collegamento, tornando indietro e cercando alternative migliori se trova la risposta sbagliata, sviluppando così un percorso neurale che porta alla risposta corretta. Questo percorso viene via via enfatizzato.

Nel caso del riconoscimento vocale, per una frase specifica registrata in una determinata lingua, c'è generalmente solo una trascrizione corretta che l'apprendimento profondo può trovare, quindi il training risulta piuttosto semplice. La traduzione comporta l'uso di materiale di training più eterogeneo ed è un'attività più complessa.

Secondo Marciano, tuttavia, apprendimento profondo e Big Data ci permettono di percepire e analizzare il mondo superando i limiti. Poiché i Big Data producono un volume di informazioni molto elevato, riusciamo a identificare modelli complessi e associazioni tra di essi in modi che vanno oltre la capacità umana.

È tuttavia difficile costruire un'immagine mentale del processo di traduzione automatica neurale. Gran parte dell'elaborazione viene eseguita in "livelli nascosti" di dati complessi e risulta quindi difficile capire in che modo la rete neurale prende le decisioni.

È per questo che possiamo solo presentare il materiale di training, lasciare che gli algoritmi facciano il loro lavoro e ottimizzare il materiale se le traduzioni non sono accurate. Lionbridge usa GeoFluent per correggere gli errori nell'output della traduzione automatica neurale.

L'uso di metodi di valutazione della qualità, come BLEU, è controverso. Se un sistema di traduzione automatica neurale sceglie una traduzione diversa da quella di riferimento per un motivo non noto, può essere penalizzato per la scelta del vocabolario, anche se il risultato è perfettamente corretto.

Il futuro delle reti neurali e della comunicazione

Sebbene sia difficile eseguire il debug di una rete neurale e comprendere il suo processo decisionale, i miglioramenti riscontrati nella qualità dei risultati sono incoraggianti e degni di nota. Ci sono altri fornitori di servizi di traduzione automatica che offrono la traduzione automatica neurale?

La risposta breve è no. Attualmente ci sono tre sistemi di traduzione automatica neurale che è possibile provare in Internet: Google Translate (che è possibile integrare in qualsiasi strumento di traduzione assistita [CAT]), Microsoft Translator e Systran Pure Neural Machine Translation. Tuttavia, siamo pionieri in termini di sistemi pronti per la produzione che dispongono di set di strumenti di training completi. Cercate gli annunci di sistemi di traduzione automatica neurale attualmente in via di sviluppo di Microsoft, Google, Systran, Baidu, Facebook, Amazon e altri.

L'implementazione della traduzione automatica neurale avverrà prima per le combinazioni linguistiche che mostrano il più alto livello di miglioramento rispetto ai sistemi di traduzione automatica statistica. In Lionbridge abbiamo in programma la valutazione dei sistemi di traduzione neurale disponibili per determinare come questi strumenti si integrano con i nostri processi di localizzazione e se sono in grado di soddisfare le esigenze dei clienti. Visitate la pagina dedicata alla traduzione automatica per scoprire le ultime tendenze.

Una cosa è certa: la traduzione automatica neurale è un punto di svolta. Considerando quanto sia giovane questo modello, i miglioramenti nella traduzione sono stati enormi rispetto agli ultimi 10 anni. La differenza tra traduzione tradizionale e traduzione automatica continuerà a ridursi e il nostro obiettivo è scoprire fino a che punto è possibile arrivare.

Per saperne di più sui vantaggi della traduzione automatica neurale e su cosa aspettarsi dal futuro dell'apprendimento automatico, guardate il webinar completo dedicato a traduzione automatica neurale e impatto sull'efficienza della traduzione

#blog_posts
#translation_localization

AUTORE

Lionbridge

SERVIZI OFFERTI

IA GENERATIVA

SETTORI

LAⁱNGUAGE CLOUD™

CHI SIAMO

Traduzione automatica neurale: modalità di funzionamento dell'intelligenza artificiale per la traduzione linguistica

Come funziona la traduzione automatica neurale

Traduzione automatica neurale e Big Data: potenzialità illimitate

Il futuro delle reti neurali e della comunicazione

LAⁱNGUAGE CLOUD™

Settori