VÄLJ SPRÅK:

Vad är maskinöversättning?

en översikt


Efter att ha funnits i snart 80 år står nu maskinöversättning i rampljuset.

AI har blivit en del av vår vardag, och neural MT har blivit något som många pratar om, oavsett bransch. Oavsett vad du har för koppling till begreppet maskinöversättning (MT) behöver du veta hur man pratar om det.

I och med att AI blir allt mer tillgängligt för företag och konsumenter uppstår nya termer. Hur skiljer man som utomstående mellan olika termer som ibland används på samma sätt?

Vad är maskinöversättning?

Vi finns här för att hjälpa dig. På Lionbridge är vi stolta över att några av världens mest erfarna MT-experter är en del av vårt företag. Tillsammans med dem har vi tagit fram den här översikten som hjälper dig att förstå dessa glödheta termer i branschen.

1. Artificiell intelligens

För att förstå de senaste trenderna inom MT måste du också känna till bakgrunden: artificiell intelligens. AI är ”intelligens” som maskiner uppvisar när de utför uppgifter som man brukar anse kräver mänskligt tänkande, till exempel inlärning och problemlösning. På senare år har den enorma datorkraft som vi har fått tillgång till gynnat AI. Ju kraftfullare datorer vi har, desto mer resurskrävande processer går det att bearbeta, vilket i sin tur möjliggör mer avancerad maskininlärning. Och det är så datorer får den kunskap som krävs för tillämpningar med artificiell intelligens.

2. Maskininlärning

Maskininlärning är ett område inom datavetenskapen som använder enorma mängder data för att lära datorer hur en uppgift ska utföras. Maskininlärning undersöker data som berör en viss uppgift, hittar mönster i dessa data och skapar kopplingar mellan dem, och använder sedan dessa nya kunskaper för att bestämma hur datorn ska utföra uppgiften. Om datorn efter dessa analyser blir bättre på att utföra uppgiften har maskininlärningen lyckats.

Eftersom vi numera har data om i princip vartenda ämne som finns kan man använda maskininlärning för att förbättra datorns möjligheter inom det mesta från väderprognoser och aktieinvesteringar till maskinöversättning.

Female standing holding a laptop

3. Maskinöversättning

Enkelt uttryckt är maskinöversättning automatiserad översättning: datorn får källtext på ett språk och översätter själv det till ett annat språk. Resultatet blir inte perfekt, men det är ett kraftfullt verktyg för att effektivt producera översättningar av hög kvalitet.

Under de senaste decennierna har MT hela tiden utvecklats i fråga om resultatets kvalitet och vilka språk som stöds. Utvecklingen av maskinöversättning speglar de stora framstegen inom datoranvändning: i början maskinöversattes texten ord för ord, vilket senare ersattes av uttryckligt kodad grammatik och lexikon inom regelbaserad MT. Beräkningsintensiv statistisk MT ersätts i dag av djup inlärning och neurala nätverk i Neural MT.

4. Statistisk maskinöversättning

Med statistisk maskinöversättning (SMT) används maskininlärning för att generera ett stort antal översättningsförslag för en mening. Sedan väljs den bästa ut baserat på hur sannolikt det är att ord och fraser förekommer tillsammans på målspråket. SMT översätter med hjälp av ”n-gram”, dvs. små grupper av ord som dyker upp tillsammans på både käll- och målspråket. Under maskininlärningen får SMT-systemet material att träna på, nämligen en stor mängd exempelmeningar på källspråket och motsvarande översättningar på målspråket. Inlärningsalgoritmen delar upp käll- och måltextens meningar i n-gram och fastställer vilka n-gram som borde användas i översättningen när ett visst n-gram förekommer i källtexten.

Sedan bygger algoritmen en språkmodell som beräknar hur sannolikt det är att vissa ord och fraser förekommer tillsammans på målspråket. När inlärningen är klar och nytt material ska översättas delar SMT-systemet upp den nya texten i n-gram, hittar frekvent förekommande n-gram i målspråket och börjar generera översättningsförslag för meningarna. Översättningen blir sedan den mening där målspråkets n-gram överensstämmer bäst med källtextens n-gram, och med de målspråksord som mest sannolikt förekommer tillsammans på målspråket.

SMT fungerar oväntat bra, särskilt med tanke på att SMT-systemet inte bygger på lingvistik eller sammanhängande meningar, utan bara på n-gram. Detta skiljer sig från det nya tillvägagångssättet för MT: neural maskinöversättning.

5. Neural maskinöversättning

Med neural maskinöversättning (NMT) slipper man den största nackdelen med SMT: användningen av n-gramanalyser. NMT ger maskinen frihet – systemet får utbildningsmaterial, precis som SMT, men annars fungerar det helt annorlunda. När systemet får materialet bestämmer det nämligen på egen hand hur det kan lära sig allt om dessa data.

NMT-system bygger informationsvektorer för varje källmening, och kopplar information om varje ord till dess omgivande ord. Vissa system kan ta fram hundratals uppgifter per ord, vilket ger stor exakthet. Genom djupinlärning kan NMT-system samla in en stor mängd information om varje ord och källmening, och sedan använda en uppmärksamhetsmodell för att fokusera på de kritiska funktioner som systemet, genom sina analyser av dessa omfattande dataströmmar, har lärt sig är viktiga för översättningsprocessen. Resultatet blir översättningar med markant bättre flyt, och datorgenererade översättningar som låter alltmer naturliga.

NMT är fortfarande i startgroparna, men det innebär en väsentlig förändring i vår bransch. Eftersom de tillgängliga verktygen hela tiden mognar och förbättras kommer vi på Lionbridge att successivt öka användningen av MT för att snabba på våra produktionsprocesser.

 

På Lionbridge har vi stor erfarenhet av MT. Vi har erbjudit MT-tjänster i stor skala sedan 2002, och de växer och blir bättre för varje år. Läs mer här om hur vi drar nytta av vår stora erfarenhet av MT för att hjälpa våra kunder.

Kontakta vårt team för att diskutera era behov av maskinöversättning.

  • #blog_posts
  • #translation_localization

Lionbridge
AUTHOR
Lionbridge