VÄLJ SPRÅK:

Using Machine Translation

Maskinöversättning vid översättning

Översikt: Maskinöversättningsterminologi från artificiell intelligens till stora språkmodeller – och allt däremellan

Efter flera decennier blomstrar maskinöversättningen (MT) i dag, och tack vare framsteg inom stora språkmodeller (LLM) har den väckt stort intresse både bland allmänheten och i språktjänstsvängen.

På senare har allt som rör artificiell intelligens (AI) blivit en del av vår vardag. Just nu är generativ AI (GenAI) det som många pratar om, i alla möjliga branscher. Oavsett vad du har för koppling till begreppet maskinöversättning behöver du veta hur man pratar om det.

I och med att AI har blivit allt mer tillgängligt för företag och konsumenter har det uppstått en hel samling närbesläktade termer. Hur skiljer man som utomstående mellan olika termer som ibland används på samma sätt?

Vad är maskinöversättning?

Vi hjälper dig. Hos oss på Lionbridge jobbar några av världens mest erfarna MT-experter och det är vi väldigt stolta över. Tillsammans med dem har vi tagit fram den här översikten, som hjälper dig att förstå branschens glödheta termer.

1. Artificiell intelligens

För att förstå de senaste trenderna inom MT måste du också känna till bakgrunden: artificiell intelligens. AI är den ”intelligens” som maskiner uppvisar när de utför uppgifter som man brukar anse kräva mänskligt tänkande, till exempel inlärning och problemlösning. Under senare år har den enorma datorkraft vi fått tillgång till gynnat AI. Ju kraftfullare datorer vi har, desto mer resurskrävande processer kan användas för att bearbeta uppgiften, vilket i sin tur möjliggör mer avancerad maskininlärning. Och det är så datorer får den kunskap som krävs för tillämpningar med artificiell intelligens.

2. Maskininlärning

Maskininlärning är ett område inom datavetenskapen som använder enorma mängder data för att lära datorer hur en uppgift ska utföras. Maskininlärning undersöker data som berör en viss uppgift, hittar mönster i dessa data och skapar kopplingar mellan dem. Sedan används de nya kunskaperna för att bestämma hur datorn ska utföra uppgiften. Om datorn efter dessa analyser blir bättre på att utföra uppgiften har maskininlärningen lyckats.

Eftersom vi numera har data om nästan vartenda ämne som finns kan man använda maskininlärning för att förbättra datorns möjligheter inom det mesta från väderprognoser och aktieinvesteringar till maskinöversättning.

3. Maskinöversättning

Enkelt uttryckt är maskinöversättning automatiserad översättning: Datorn får källtext på ett språk och översätter själv det till ett annat språk. Resultatet blir inte perfekt, men det är ett kraftfullt verktyg för att effektivt producera översättningar av hög kvalitet.

Under de senaste decennierna har MT förbättrats sett till både kvalitet och vilka språk som stöds. Utvecklingen av maskinöversättning speglar de stora framstegen inom datoranvändning: I början maskinöversattes texten ord för ord, vilket senare ersattes av uttryckligt kodad grammatik och lexikon inom regelbaserad MT. Beräkningsintensiv statistisk MT ersätts i dag av djupinlärning och neurala nätverk i neural MT och det allra senaste är generativ AI, som ger resultat läskigt lika dem producerade av en människa.

På vår sida för tankeledarskap om maskinöversättning kan du läsa mer om de senaste trenderna inom MT.

Ett futuristiskt hologram av maskinöversättning

4. Statistisk maskinöversättning

Vid statistisk maskinöversättning (SMT) används maskininlärning för att generera ett stort antal översättningsförslag för en viss källmening. Därefter väljer den det bästa förslaget baserat på sannolikheten att ord och fraser förekommer tillsammans på målspråket. SMT lär sig om översättning genom att analysera utifrån ”n-gram” – små ordgrupper som förekommer tillsammans i käll- och målspråket. Under maskininlärningen får SMT-systemet material att träna på, nämligen en stor mängd exempelmeningar på källspråket och motsvarande översättningar på målspråket. Inlärningsalgoritmen delar upp käll- och måltextens meningar i n-gram och fastställer vilka n-gram som bör användas i översättningen när ett visst n-gram förekommer i källtexten.

Sedan bygger algoritmen en språkmodell som beräknar hur sannolikt det är att vissa ord och fraser förekommer tillsammans på målspråket. När inlärningen är klar och nytt material ska översättas delar SMT-systemet upp den nya texten i n-gram, hittar vanligt förekommande n-gram i målspråket och genererar översättningsförslag för meningarna. Översättningen blir sedan den mening där målspråkets n-gram stämmer bäst överens med källtextens n-gram, och med de målspråksord som mest sannolikt förekommer tillsammans på målspråket.

SMT fungerar oväntat bra med tanke på att SMT-systemet inte bygger på lingvistik eller sammanhängande meningar, utan bara på n-gram. Detta skiljer sig från det nya tillvägagångssättet för MT: neural maskinöversättning.

5. Neural maskinöversättning

Med neural maskinöversättning (NMT) slipper man den största nackdelen med SMT: användningen av n-gramanalyser. NMT ger maskinen frihet – systemet får utbildningsmaterial, precis som SMT, men annars fungerar det helt annorlunda. När systemet tar emot materialet bestämmer det själv hur det på egen hand kan lära sig allt om informationen.

NMT-system bygger informationsvektorer för varje källmening och kopplar information om varje ord till dess omgivande ord. Vissa system kan ta fram hundratals uppgifter per ord, vilket ger stor exakthet. Genom djupinlärning kan NMT-system samla in en stor mängd information om varje ord och källmening och sedan använda en så kallad uppmärksamhetsmodell för att fokusera på de kritiska funktioner som systemet, genom analyser av dessa omfattande dataströmmar, har lärt sig är viktiga för översättningsprocessen. Resultatet har blivit översättningar med markant bättre flyt, och datorgenererade översättningar som börjar låta alltmer naturliga.

NMT har inneburit en väsentlig förändring i vår bransch och vi har ökat användningen av MT för att snabba på våra produktionsprocesser i takt med att verktygen mognat och tekniken utvecklats. Under 2022 lyckades de stora neurala maskinöversättningsmotorerna inte höja kvaliteten i någon större omfattning, vilket är en tydlig signal om ett kommande paradigmskifte.

Tekniskt nätverk

6. Generativ AI/Stora språkmodeller

Generativ AI är ett AI-system som kan generera nytt innehåll, bland annat text och bilder, baserat på prompter och omfattande multimodal träning. Tekniken är känd för sin förmåga att generera resultat i klass med människan. En stor språkmodell är ett AI-system inriktat på språk. Det kan sammanfatta, översätta, förutse och generera text utifrån kunskap insamlad från enorma databaser. Även om systemet inte har tränats specifikt för att översätta text kan det göra det med god (om än inte perfekt) kvalitet och resultaten förbättras i hög takt. ChatGPT var den första LLM som blev tillgänglig för allmänheten i november 2022. Den lockade 100 miljoner användare på bara två månader efter lansering.

I takt med att GenAI/LLM-tekniken blir allt skickligare kan den ta över monotona och grundläggande, språkliga aktiviteter. Vi förväntar oss att den kommer att ge människan möjlighet att i stället lägga mer tid på följande tre områden:

  • Idéutformning av innehåll – skapande av innehåll inleds alltid med att en människa får en idé.
  • Validering av innehåll – människan säkerställer att innehållet är korrekt, säkert och äkta.
  • Analys av innehållet – människan möjliggör mer omfattande övervakning och bättre resultat.

Det kommer att bli lättare för företag att ha råd med värdefulla tjänster som transkreation, vilket i slutändan leder till att varumärken kan leverera innehåll som uppskattas mer av kunderna och är mer övertygande och tillförlitligt för kunder i olika länder. Lionbridge utvecklar tillämpningar för att kunna utnyttja LLM:ernas fulla potential och automatisera lokaliseringsarbetsflöden.

7. Maskinöversättning med stora språkmodeller

Maskinöversättning med stora språkmodeller handlar om att LLM MT en dag kan ta över stafettpinnen efter paradigmet neural MT, men tekniken är inte mogen ännu. LLM producerar hyfsade resultat och OpenAI:s GPT-4-modell har till och med överträffat den neurala maskinöversättningsmotorn Yandex i språkkombinationen engelska till kinesiska i en av Lionbridges bedömningar. Trots detta kan LLM när detta skrivs ännu inte leverera hastighet, kvalitet och prisvärdhet på samma nivå som de fem största neurala maskinöversättningsmotorerna. De är därför ännu inte något lämpligt alternativ till neurala MT-motorer. Lionbridge övervakar LLM-modellernas maskinöversättningsresultat genom Lionbridges bedömningsverktyg för maskinöversättning. Verktyget mäter numera även flera LLM-modeller och analyserar bland annat maskinöversättning med GPT-4.

8. AI-översättning med en människa i processen

AI-översättning med en människa i processen handlar om att människa och maskin arbetar tillsammans för att producera de översättningsresultat du behöver.

Även om GenAI/LLM gör översättningen mer effektiv och kostnadseffektiv är mänskliga experter oumbärliga av följande anledningar:

  • Tekniken kan inte ersätta människans sinnrikhet.
  • Du kan inte helt förlita dig på tekniken utan övervakning.
  • Tekniken kan inte köras helt självständigt.

Det behövs mänskliga experter som kan hantera vissa allvarliga problem som LLM medför och tillföra ett värde på följande sätt:

  • De granskar hela översättningsresultatet, vilket är särskilt viktigt för att innehållet ska bli konsekvent. GenAI/LLM-tekniken fungerar bäst när prompterna består av högst några hundra ord – en begränsning som ofta resulterar i brottstycken av inkonsekventa översättningsresultat.

  • De skapar flera ordlistor och instruktioner per projekttyp som omvandlas till en serie prompter för att uppnå en konsekvent varumärkesröst.

  • De skapar prompter, ett första steg och en viktig förutsättning för att GenAI/LLM ska arbeta effektivt och som tekniken inte kan utföra på egen hand.

  • De skapar sofistikerade, dedikerade plattformar som samlar tusentals prompter, återanvänder prompter och tillför de instruktioner och ordlistor som krävs för att få fram önskade resultat. Lionbridge har designat och sjösatt en promptplattform som används för att återvinna och återanvända effektiva prompter.

  • De avgör hur LLM-tekniken kan integreras i befintliga arbetsflöden som använder översättningsminnen och neural maskinöversättning parallellt i syfte att spara tid, arbete och pengar. Lionbridges dedikerade AI-team är experter på att införliva LLM i befintliga arbetsflöden.

Varför Lionbridge

På Lionbridge har vi stor erfarenhet av MT. Vi har erbjudit MT-tjänster i stor skala sedan 2002 och går i täten för den senaste och mest intressanta utvecklingen. Läs Lionbridges maskinöversättningsrapport för att få en helhetsbild av MT.

Kontakta oss

Är du intresserad av att använda de senaste verktygen för att automatisera dina översättningar? Kontakta oss för att få veta mer.

linkedin sharing button
  • #blog_posts
  • #translation_localization

FÖRFATTARE
Lionbridge