Commenti degli esperti Lionbridge: analisi della traduzione automatica

Gli esperti di tecnologia di Lionbridge esaminano i paradigmi di traduzione automatica e intelligenza artificiale generativa e condividono informazioni utili sulle tendenze più recenti in materia di traduzione automatica.

CONTATTATECI

La tecnologia di traduzione automatica mantiene la sua rilevanza nonostante la natura innovativa dell'intelligenza artificiale generativa.

Un periodo ricco di cambiamenti: informazioni sugli sviluppi nella traduzione automatica

Da tempo affermiamo che il paradigma della traduzione automatica (MT) è pronto per un cambiamento radicale. Leggete i commenti dei nostri esperti per scoprirne i motivi.

I nostri esperti in traduzione automatica forniscono informazioni utili su numerosi argomenti, tra cui:

Le prestazioni di traduzione dei motori di traduzione automatica e dei modelli di intelligenza artificiale generativa (GenAI) in determinati momenti e il significato dei risultati in un contesto più ampio
I limiti degli strumenti di traduzione automatica
I modi per aumentare l'efficacia della traduzione automatica

Meglio comprendete la traduzione automatica e l'intelligenza artificiale generativa, più riuscirete a utilizzare questi strumenti in modo selettivo per soddisfare le vostre esigenze. Sfruttate i punti di forza offerti da ciascun paradigma per ottenere una maggiore efficienza nella traduzione, un aumento della produzione di contenuti e risparmi sui costi.

Commento dell'esperto Lionbridge in primo piano

Caratteristiche degne di nota di GPT-4, ottobre 2023

Considerando la diffusione e le promesse dell'intelligenza artificiale generativa (GenAI) e dei Large Language Model (LLM), abbiamo migliorato il report di valutazione della qualità della traduzione automatica di Lionbridge. Da ora in avanti, il report includerà i risultati di traduzione di GPT-4, oltre a quelli di GPT-3.5 e Davinci, e, naturalmente, le prestazioni dei motori di traduzione neurale (NMT).

Quali sono state le nostre scoperte più recenti? Alcune caratteristiche degne di nota di GPT-4.

Abbiamo esaminato diversi problemi di GPT-4, tra cui le prestazioni lente, l'incapacità di fornire traduzioni per varie ragioni e comportamenti non coerenti, come la mancata produzione di traduzioni in alcune esecuzioni ma non in altre.

Risultato 1 - Incapacità di GPT-4 di tradurre alcuni testi.

GPT-4 non ha tradotto una frase specifica nel nostro set di test per la traduzione automatica.

Dopo una ricerca, abbiamo determinato che il problema era causato da un termine che in contesti specifici può avere una connotazione sessuale. La frase nel nostro set di test era in realtà del tutto standard e accettabile. Tuttavia, il termine ha comunque causato l'attivazione del filtro del contenuto sessuale di GPT-4 e l'intelligenza artificiale di conseguenza ha censurato la traduzione della frase e non ha prodotto alcun risultato. Siamo rimasti sorpresi da questo risultato per due motivi:

L'uso tipico del termine isolato non comportava alcun problema.

Il contesto della frase specifica non aveva interpretazioni problematiche.

Abbiamo concluso che probabilmente una parte del meccanismo di filtro di GPT-4 si basa su un semplice elenco di parole proibite che include anche i termini ambigui. Questo approccio è problematico poiché può comportare l'attivazione eccessiva del meccanismo di filtro e la generazione di falsi positivi, causando gravi problemi per la traduzione professionale.

Poiché le tecnologie di traduzione automatica precedenti, come i motori di traduzione automatica neurale, non presentano questo tipo di problema di filtro dei contenuti, possiamo concludere che questa sia una limitazione della tecnologia LLM.

Questa limitazione ha alcune implicazioni in scenari reali. Immaginiamo, ad esempio, di dover tradurre contenuti medici legati alla ginecologia o all'educazione sessuale. La tecnologia LLM potrebbe non tradurre alcune parti del testo.

È interessante notare che questo problema si è verificato solo traducendo la frase specifica in una determinata lingua, ovvero il cinese, ma non in caso di traduzione in altre lingue. Ciò indica che il filtro viene applicato all'output di GPT-4. La soluzione consiste nel disattivare i filtri del contenuto per le attività di traduzione.

Risultato 2 - Variabilità dell'output di GPT-4.

Dopo cinque settimane di monitoraggio, abbiamo riscontrato un'elevata variabilità nell'output della traduzione automatica tramite LLM, in particolare con GPT-4.

Sebbene ci aspettassimo questo risultato per l'intelligenza artificiale generativa, la variabilità è stata maggiore di quanto previsto, anche usando l'impostazione dei parametri Temperature e Top Probability (Top_p) in modo da ridurre la creatività e rendere l'output più deterministico. L'output della traduzione è stato diverso in ogni esecuzione di GPT, anche eseguendo le traduzioni una di seguito all'altra.

Le traduzioni, anche se diverse, erano entrambe accettabili. Questo rappresenta tuttavia un altro aspetto da tenere sotto controllo e che differenzia questa tecnologia dal paradigma precedente della traduzione automatica neurale.

Stiamo iniziando a pensare che questo potenziale cambiamento di paradigma, dalla traduzione automatica neurale a quella basata su LLM, potrebbe non rappresentare solo un cambiamento tecnologico, ma richiedere anche un cambiamento di mentalità: potremmo doverci preparare a convivere con output meno deterministici, anche quando usiamo gli stessi input e gli stessi parametri, e aspettarci una maggiore variabilità rispetto a quanto siamo abituati a ottenere con l'automazione attuale.

Pur dovendo convivere con un certo grado di incertezza, potrebbe essere possibile usare alcuni meccanismi e best practice per rendere la variabilità controllabile, almeno in parte.

Osservando il nostro grafico tenete inoltre presente che la diminuzione della distanza di edit per GPT-4 non indica una diminuzione della qualità. Si tratta semplicemente di un riflesso della variabilità degli output di GPT. Il mese prossimo, potremmo vedere la linea salire. Continuate a seguirci per scoprire gli sviluppi futuri e per altri approfondimenti.

—Rafa Moral, Lionbridge Vice President, Innovation

Indice degli argomenti dei commenti degli esperti

Leggete gli executive summary di seguito per scoprire gli argomenti trattati in passato dagli esperti.

Marzo 2023 — Un modello LLM (Large Language Model) supera un motore di traduzione automatica neurale: cosa ci riserva il futuro?

Febbraio 2023 — Miglioramento della traduzione automatica: personalizzazione e addestramento della traduzione automatica

Gennaio 2023 — Confronto della qualità della traduzione tra ChatGPT e i principali motori di traduzione automatica

Novembre 2022 — Miglioramento della traduzione automatica Microsoft

Ottobre 2022 — Traduzione automatica e formalità del linguaggio

Settembre 2022 — Uso della terminologia per migliorare la qualità della traduzione automatica

Agosto 2022 — Evitare gli errori catastrofici durante la traduzione automatica

Luglio 2022 — Classifica delle lingue per la traduzione automatica

Giugno 2022 — Analisi accurata della qualità della traduzione automatica

Maggio 2022 — Prestazioni di Amazon e Yandex nel mese di maggio

Aprile 2022 — Prestazioni di Yandex in aprile

Marzo 2022 — Valutazioni comparative personalizzate della traduzione automatica

Febbraio 2022 — Il futuro della traduzione automatica neurale (NMT)

Gennaio 2022 — Prestazioni dei motori di traduzione automatica a gennaio

Dicembre 2021 — Lionbridge aggiunge la traduzione automatica di Yandex allo strumento comparativo di valutazione della qualità della traduzione automatica.

Novembre 2021 — Bing Translator apporta alcuni miglioramenti

Ottobre 2021 — Progressi del motore di traduzione automatica di Amazon

Settembre 2021 — Amazon apporta alcuni miglioramenti alla qualità della traduzione automatica

Agosto 2021 — Principali aziende tecnologiche e sviluppo dei rispettivi motori di traduzione automatica

Strumento di valutazione della traduzione automatica Lionbridge

Lo strumento di valutazione della traduzione automatica Lionbridge è il metodo usato più da lungo tempo nel settore per valutare la traduzione automatica.

Lo strumento misura la prestazioni complessive dei cinque principali motori di traduzione automatica neurale e di alcuni modelli di intelligenza artificiale generativa (GenAI). Valuta inoltre la qualità della traduzione in base a combinazioni linguistiche e domini. A parte alcune eccezioni, l'intelligenza artificiale generativa non supera i principali motori di traduzione automatica neurale. Questo modelli producono tuttavia risultati discreti, in particolare se si considera che non sono stati addestrati esplicitamente per la traduzione.

Qual è la principale conclusione? In un clima di forte interesse per lo sviluppo di GenAI/LLM, la traduzione automatica continua a dimostrarsi un valido strumento.

I risultati delle traduzioni variano continuamente e lo strumento di valutazione riflette queste fluttuazioni.

Passate allo strumento di valutazione

Commenti degli esperti Lionbridge

Ottenete utili informazioni dai nostri esperti in traduzione automatica.

Marzo 2023

L'intelligenza artificiale generativa ha raggiunto un importante traguardo: ha superato un motore di traduzione automatica neurale in una delle nostre valutazioni comparative. Nello specifico, il Large Language Model (LLM) GPT-4 ha fornito una qualità leggermente migliore rispetto a Yandex per la combinazione linguistica dall'inglese al cinese, come illustrato nella Figura 1.

Questo risultato è degno di nota perché è la prima volta dal suo avvento che la traduzione automatica neurale viene superata da un diverso tipo di approccio alla traduzione automatica. Inoltre, un approccio "non MT", ossia un'automazione linguistica polifunzionale non preparata specificamente per la traduzione automatica, ha battuto un motore di traduzione automatica neurale.

Perché si tratta di un evento importante? Se siete fornitori di servizi di traduzione automatica, dovete essere in prima linea nel cambiamento tecnologico e valutarne l'impatto sulla vostra attuale soluzione di traduzione automatica per rimanere competitivi. Se siete acquirenti di servizi di traduzione automatica, dovete essere al corrente di questi sviluppi per fare investimenti oculati che probabilmente includeranno alcune tecnologie basate sui modelli LLM al posto di soluzioni di traduzione automatica neurale pura.

È importante sottolineare che l'intelligenza artificiale generativa è ancora nelle fasi iniziali, pertanto risulta inferiore alle aspettative in alcune aree chiave. Produce ad esempio output variabili in caso di esecuzioni multiple, ha un'API (Application Programming Interface) instabile e commette più errori rispetto ai motori di traduzione automatica neurale. Questi problemi dovranno essere risolti per permettere alla tecnologia di diventare più matura e stiamo già assistendo ad alcuni miglioramenti che avvengono a una velocità straordinaria.

L'incredibile velocità con cui i modelli LLM sono in grado di migliorare supporta l'idea che saranno probabilmente destinati a diventare il prossimo paradigma per la traduzione automatica. Con l'evoluzione del paradigma, ci aspettiamo un periodo ibrido in cui i fornitori di servizi di traduzione automatica neurale integreranno alcuni aspetti dei modelli LLM nell'architettura di traduzione automatica neurale.

Leggete il nostro blog per un confronto della qualità di traduzione tra la traduzione automatica neurale e i modelli LLM per altre due combinazioni linguistiche e per ulteriori considerazioni sul fatto che stiamo assistendo all'inizio della fine del paradigma di traduzione automatica neurale.

—Rafa Moral, Lionbridge Vice President, Innovation

	Personalizzazione della traduzione automatica
Che cos'è e come funziona	Adattamento di un motore di traduzione automatica preesistente con un glossario e un elenco di termini da non tradurre (DNT) per migliorare la precisione delle traduzioni generate automaticamente
Cosa fa	Migliora i suggerimenti della traduzione automatica per un output più preciso e riduce la necessità di post-editing
Vantaggi specifici	Consente alle aziende di mantenere coerente l'identità e la terminologia del brand e di applicare varianti in base all'area geografica
Rischi legati all'uso	Se gestita in modo non appropriato, la traduzione automatica può produrre suggerimenti scadenti e avere un impatto negativo sulla qualità complessiva
Quando si usa	Ideale per contenuti tecnologici e orientati ai dettagli, nonché contenuti che richiedono: Traduzioni accurate della terminologia Varianti regionali quando i dati non sono sufficienti per l'addestramento
Fattori di successo	Un professionista esperto nella traduzione automatica in grado di gestire correttamente le regole di normalizzazione di input e output, i glossari e gli elenchi di termini da non tradurre
Considerazioni sui costi	Sono previsti un costo una tantum per aggiornare il profilo da inserire nel motore di traduzione automatica e alcuni costi periodici per la gestione del glossario nel tempo; la soluzione è piuttosto economica se si tiene conto dei benefici e i costi sono in genere inferiori rispetto a quelli associati all'addestramento della traduzione automatica

	Addestramento della traduzione automatica
Che cos'è e come funziona	Processo che prevede la creazione e l'addestramento di un motore di traduzione automatica tramite l'impiego di grossi volumi di dati bilingue provenienti da corpora e memorie di traduzione per migliorare la precisione delle traduzioni generate automaticamente
Cosa fa	Migliora i suggerimenti della traduzione automatica per un output più preciso e riduce la necessità di post-editing
Vantaggi specifici	Consente alle aziende di applicare un'identità, un tono e uno stile specifici del brand, nonché varianti in base all'area geografica
Rischi legati all'uso	L'addestramento della traduzione automatica potrebbe non avere alcun impatto sull'output se c'è un volume insufficiente di dati di qualità, mentre potrebbe produrre suggerimenti scadenti e avere un impatto negativo sulla qualità complessiva se autori inesperti usano la terminologia in modo non appropriato
Quando si usa	Ideale per contenuti altamente specializzati, di marketing e creativi, nonché contenuti che richiedono: Identità, tono o stile del brand specifico Varianti regionali quando i dati sono sufficienti per l'addestramento
Fattori di successo	Almeno 15.000 segmenti univoci per addestrare adeguatamente il motore
Considerazioni sui costi	Sono previsti costi associati al primo processo di addestramento e costi potenziali per gli interventi successivi, che possono rendersi necessari nel tempo se il monitoraggio delle prestazioni della traduzione automatica indica margini di miglioramento; in determinati casi, l'investimento risulta vantaggioso se si considerano i potenziali benefici

	Personalizzazione della traduzione automatica	Addestramento della traduzione automatica
Che cos'è e come funziona	Adattamento di un motore di traduzione automatica preesistente con un glossario e un elenco di termini da non tradurre (DNT) per migliorare la precisione delle traduzioni generate automaticamente	Processo che prevede la creazione e l'addestramento di un motore di traduzione automatica tramite l'impiego di grossi volumi di dati bilingue provenienti da corpora e memorie di traduzione per migliorare la precisione delle traduzioni generate automaticamente
Cosa fa	Migliora i suggerimenti della traduzione automatica per un output più preciso e riduce la necessità di post-editing	Migliora i suggerimenti della traduzione automatica per un output più preciso e riduce la necessità di post-editing
Vantaggi specifici	Consente alle aziende di mantenere coerente l'identità e la terminologia del brand e di applicare varianti in base all'area geografica	Consente alle aziende di applicare un'identità, un tono e uno stile specifici del brand, nonché varianti in base all'area geografica
Rischi legati all'uso	Se gestita in modo non appropriato, la traduzione automatica può produrre suggerimenti scadenti e avere un impatto negativo sulla qualità complessiva	L'addestramento della traduzione automatica potrebbe non avere alcun impatto sull'output se c'è un volume insufficiente di dati di qualità, mentre potrebbe produrre suggerimenti scadenti e avere un impatto negativo sulla qualità complessiva se autori inesperti usano la terminologia in modo non appropriato
Quando si usa	Ideale per contenuti tecnologici e orientati ai dettagli, nonché contenuti che richiedono: Traduzioni accurate della terminologia Varianti regionali quando i dati non sono sufficienti per l'addestramento	Ideale per contenuti altamente specializzati, di marketing e creativi, nonché contenuti che richiedono: Identità, tono o stile del brand specifico Varianti regionali quando i dati sono sufficienti per l'addestramento
Fattori di successo	Un professionista esperto nella traduzione automatica in grado di gestire correttamente le regole di normalizzazione di input e output, i glossari e gli elenchi di termini da non tradurre	Almeno 15.000 segmenti univoci per addestrare adeguatamente il motore
Considerazioni sui costi	Sono previsti un costo una tantum per aggiornare il profilo da inserire nel motore di traduzione automatica e alcuni costi periodici per la gestione del glossario nel tempo; la soluzione è piuttosto economica se si tiene conto dei benefici e i costi sono in genere inferiori rispetto a quelli associati all'addestramento della traduzione automatica	Sono previsti costi associati al primo processo di addestramento e costi potenziali per gli interventi successivi, che possono rendersi necessari nel tempo se il monitoraggio delle prestazioni della traduzione automatica indica margini di miglioramento; in determinati casi, l'investimento risulta vantaggioso se si considerano i potenziali benefici

SERVIZI OFFERTI

SETTORI

RISORSE

CHI SIAMO

Commenti degli esperti Lionbridge: analisi della traduzione automatica

La tecnologia di traduzione automatica mantiene la sua rilevanza nonostante la natura innovativa dell'intelligenza artificiale generativa.

Un periodo ricco di cambiamenti: informazioni sugli sviluppi nella traduzione automatica

Commento dell'esperto Lionbridge in primo piano

Caratteristiche degne di nota di GPT-4, ottobre 2023

Quali sono state le nostre scoperte più recenti? Alcune caratteristiche degne di nota di GPT-4.

Risultato 1 - Incapacità di GPT-4 di tradurre alcuni testi.

Risultato 2 - Variabilità dell'output di GPT-4.

Indice degli argomenti dei commenti degli esperti

Strumento di valutazione della traduzione automatica Lionbridge

Commenti degli esperti Lionbridge

Marzo 2023

Febbraio 2023

Confronto tra personalizzazione e addestramento della traduzione automatica

Gennaio 2023

Novembre 2022

Ottobre 2022

Settembre 2022

Agosto 2022

Luglio 2022

Giugno 2022

Maggio 2022

Aprile 2022

Marzo 2022

Febbraio 2022

Gennaio 2022

Dicembre 2021

Novembre 2021

Ottobre 2021

Settembre 2021

Agosto 2021

I nostri esperti di traduzione automatica

Rafa Moral

Yolanda Martin

Thomas McCarthy

Compilate il modulo di contatto per parlare con i nostri consulenti.

Richiedete una consulenza

Settori