Fallstudie: Flerspråkiga kampanjer i detaljhandeln
Nya AI-baserade lösningar för skapande av innehåll hos stort sport- och klädföretag
Mänsklig expertis och kraftfull AI hand i hand
Lionbridge Aurora AI™ är en global AI‑plattform som stärker flerspråkigt innehåll och utökar publiken med relevant, anpassat innehåll.
Lionbridges kunskapscenter
I dag känner sig företag alltmer pressade att översätta mer innehåll snabbare. Maskinöversättning (MT) är därför fortfarande en viktig del av lösningen – trots att generativ AI (GenAI) blomstrar.
För att få ut mesta möjliga av MT bör du även fundera över hur enkelt det är för olika MT-motorer att översätta vissa språkkombinationer och ta hänsyn till olika språks översättningsbarhet. För att du enklare ska kunna jämföra språk har vi tagit fram en lista med de 28 vanligaste målspråken från engelska i tabell 1.
Genom att ta reda på hur maskinöversättningsbara språkkombinationer är kan du enklare avsätta rätt budget när du planerar översättningskostnader för olika språk. På så sätt får du en bättre uppfattning om vilka språkkombinationer som kräver mer resurser att översätta.
Insikter om språkens komplexitet kan hjälpa dig att fatta bättre affärsbeslut:
Det är inte helt enkelt att ta reda på hur lätt det är att maskinöversätta språk. Det finns en rad olika utmaningar som skiljer sig åt mellan språk. Och det som betraktas som ett bra resultat för ett språk anses otillräckligt för ett annat. Vi kan dock använda vissa mått för att göra en bedömning.
Till exempel kan redigeringsavstånd användas. Det är ett mått för hur många ändringar en efterredigerare gör för att se till att den färdiga texten håller lika hög kvalitet som efter manuell översättning. Det kan ge oss en uppfattning om hur komplext språket är, så att vi enklare kan avgöra hur svårt det är att maskinöversätta olika språkkombinationer – även om måttet vanligtvis inte används för att jämföra språk.
Lionbridge har rankat hur lätt det är att maskinöversätta 28 målspråk från engelska, baserat på vår behandling av miljontals meningar.
Resultaten visar att det finns ett samband mellan hur komplex maskinöversättningen är och vilken familj språket tillhör.
De flesta romanska språk, som portugisiska, spanska, franska och italienska, kräver färre ändringar för att uppnå hög kvalitet vid översättning från engelska. Vi har fastställt att de här målspråken är enklast för maskiner att hantera, och de knep de fyra första platserna i vår lista över språk som är lättast att maskinöversätta till.
Det är värt att notera att rumänska, det femte språket på listan som tillhör den romanska språkfamiljen, hamnar längre ner på rankningslistan, nämligen på plats tio. Det här resultatet, för det romanska språk som översätts minst, beror förmodligen på att det finns ett mindre förråd av tvåspråkiga träningsdata som används för att träna MT-motorer. En annan förklaring är att rumänska har en komplicerad grammatik som delar vissa likheter med latin.
Förenklad kinesiska – ett språk som skiljer sig avsevärt från engelska – hamnar på femte plats på vår lista, direkt efter de fyra romanska språken i topp. Vi tillskriver den här höga placeringen återkommande uppdateringar och förbättringar av MT för den här språkkombinationen de senaste fem åren, något vi har kunnat se i vår kontinuerliga MT-spårning under den här tiden. MT-företag investerar mer i den här språkkombinationen för att uppnå bättre prestanda, eftersom det finns så starka affärsintressen här.
Ungerska och finska – två uraliska språk – är mer komplicerade. De hamnade sist på vår lista med plats 27 respektive 28. Estniska, ett komplext språk i samma familj, hamnar på 24:e plats på listan.
Koreanska rankades nästan lägst och ligger på 25:e plats på vår lista.
Jämförelser mellan språk har visserligen sina begränsningar, men rankningen och sambanden mellan komplexitet och språkfamiljer kan ändå ge intressanta insikter som kan hjälpa dig att hantera flerspråkiga projekt bättre.
Tabell 1
Rankning av språks maskinöversättningsbarhet
| Plats | Språk (från engelska) | Plats | Språk (från engelska) | Plats | Språk (från engelska) |
|---|---|---|---|---|---|
| 1 | Portugisiska | 11 | Thailändska | 20 | Kinesiska (traditionell) |
| 2 | Spanska | 12 | Norska | 21 | Litauiska |
| 3 | Franska | 13 | Tyska | 22 | Tjeckiska |
| 4 | Italienska | 14 | Svenska | 23 | Arabiska |
| 5 | Kinesiska (förenklad) | 15 | Turkiska | 24 | Estniska |
| 6 | Nederländska | 16 | Slovakiska | 25 | Koreanska |
| 7 | Danska | 17 | Hebreiska | 26 | Ryska |
| 8 | Japanska | 18 | Lettiska | 27 | Ungerska |
| 9 | Grekiska | 19 | Polska | 28 | Finska |
| 10 | Rumänska |
Tabell 1
Rankning av språks maskinöversättningsbarhet
| Plats | Språk (från engelska) |
|---|---|
| 1 | Portugisiska |
| 2 | Spanska |
| 3 | Franska |
| 4 | Italienska |
| 5 | Kinesiska (förenklad) |
| 6 | Nederländska |
| 7 | Danska |
| 8 | Japanska |
| 9 | Grekiska |
| 10 | Rumänska |
| 11 | Thailändska |
| 12 | Norska |
| 13 | Tyska |
| 14 | Svenska |
| 15 | Turkiska |
| 16 | Slovakiska |
| 17 | Hebreiska |
| 18 | Lettiska |
| 19 | Polska |
| 20 | Kinesiska (traditionell) |
| 21 | Litauiska |
| 22 | Tjeckiska |
| 23 | Arabiska |
| 24 | Estniska |
| 25 | Koreanska |
| 26 | Ryska |
| 27 | Ungerska |
| 28 | Finska |
Kontakta oss i dag om du vill veta mer om hur Lionbridge kan hjälpa dig att införliva MT-verktyg i AI-baserade översättningsarbetsflöden för att möjliggöra snabb och effektiv flerspråkig kommunikation.
Obs! Bloggen är en uppdatering av ett inlägg som ursprungligen publicerades 2022.