VÄLJ SPRÅK:

Finger points to circular rings

Terminologi kan förbättra maskinöversättningar

Noggrann sammanställning och hantering av terminologi kan hjälpa dig att höja kvaliteten på maskinöversättningar

Det blir allt vanligare att både experter och allmänhet använder generiska och fritt tillgängliga maskinöversättningssystem. Därför är det viktigt att vara medveten om att motorerna kan producera undermåliga översättningar. Dålig kvalitet eller katastrofala fel kan få ödesdigra konsekvenser för företag. Men det finns flera sätt att höja maskinöversättningskvaliteten, bland annat genom effektiv hantering av MT-terminologi.

Vilka utmaningar skapar terminologi för maskinöversättning?

Sambandet mellan olika begrepp och deras representation i form av terminologienheter är komplicerat. Därför är terminologi fortfarande en av de största utmaningarna för maskinöversättning.

Om kostnadsfria MT-system används inom vissa områden kan det ge oönskade resultat ur ett terminologiskt perspektiv. Effekterna kan bli särskilt allvarliga på de medicinska och juridiska områdena.

Det går visserligen att träna MT-system med en språkkorpus från ett visst ämnesområde för att viss mån förhindra dåliga resultat. Om allmänna MT-system används kan man dock inte garantera att terminologi används korrekt och konsekvent.

Kvaliteten på översättningen från en MT-motor beror på bland annat kvaliteten hos tvåspråkiga träningsdata. Det innebär att det bara går att garantera att terminologi översätts korrekt om korpus innehåller de aktuella termerna i både käll- och måltext.

Neurala maskinöversättningssystem (NMT) bygger visserligen på en sannolikhetsbaserad distribution av termer, men även om förekomsten av dem är nödvändig är de inte någon garanti för översättningar av hög kvalitet. Termerna måste ha tillräckligt hög frekvens i språkkorpus för att avkodaren ska kunna samla in exakta motsvarigheter i måltexten. Om en viss term inte förekommer så ofta får den inte tillräckligt stor vikt för att betraktas som kandidat för motsvarigheter på målspråket och översätts därmed inte korrekt.

En hand sträcker sig mot en glob som pryds av bilder på människor

Varför leder generisk MT-träning till felaktiga översättningar?

Generiska MT-system tränas ofta med en stor språkkorpus med varierat innehåll. Det innebär att den vanligaste kandidattermen och dess möjliga motsvarighet kanske hör till ett annat ämnesområde än den term som ska översättas. Det kan leda till att termer översätts felaktigt till målspråket.

Till exempel kan den spanska termen fósforo översättas med tändsticka (det föremål som används för att tända eld) eller som fosfor (ett grundämne). Det är svårt för en allmän MT-motor att skilja på olika avsedda betydelser och översättningen kan resultera i ett fel.

Lösningen på det här problemet är att träna anpassade MT-system med tvåspråkiga texter från det aktuella området som även innehåller specialiserad terminologi.

Om terminologin inte används konsekvent går det emellertid inte att garantera att översättningarna blir helt perfekta, även om motorerna tränas med specialiserade texter.

Vilka lösningar finns det på marknaden?

Forskare på det här området rekommenderar att språkinformation läggs in i NMT-system med hjälp av märkning.

Möjligheten att manuellt eller halvautomatiskt märka upp data beror på tillgängliga resurser, som ordlistor, och begränsningar, som tid, kostnad och tillgång till medarbetare som kan utföra märkningen.

Vilken lösning erbjuder Lionbridge?

Lionbridges Smairt MT™ kan användas för att lägga till språkliga regler i käll- och måltexten och för att tillämpa terminologi baserat på ordlistor och listor med ord som inte ska översättas, som läggs till i en viss profil.

Vi hjälper våra kunder att skapa och underhålla ordlistor, som regelbundet förfinas genom att lägga till nya, relevanta termer och ta bort föråldrad terminologi. När ordlistor väl har skapats i Smairt MT kan de sedan användas till alla MT-motorer, vilket sparar både tid och pengar.

Hur använder du bäst ordlistor i maskinöversättningsprojekt?

Det är dock inte lika enkelt som man kan tro att använda ordlistor till MT-projekt. Om ordlistor används på ett felaktigt sätt kan de ha negativ effekt på maskinöversättningens allmänna kvalitet. Det bästa sättet att följa terminologi i MT är genom MT-träning.

Genom att kombinera tränade MT-motorer med anpassade ordlistor och identifiering av regler för för- och efterbehandling kan man se till att maskinöversatta texter innehåller rätt terminologi och har en stil som stämmer överens med kundens övriga dokumentation.

Prickar och tredimensionella kuber täcker en mörk bakgrund

Vilka funktioner för terminologihantering ska du titta efter i en maskinöversättningslösning?

När du bedömer funktioner för terminologihantering i en maskinöversättningslösning ska du undersöka om lösningen kan

  • hantera ordlistor
  • hantera listor med ord som inte ska översättas
  • hantera föreslagna och godkända översättningar
  • massuppladda termer och meningar genom import av ordlistor och översättningsminnen
  • skapa områdes- eller produktspecifika MT-motorprofiler och automatisera befordran av innehåll mellan motorerna.

Tillsammans kan de här funktionerna bidra till översättningar av högre kvalitet.

Hur fungerar Lionbridges Smairt MT-lösning?

Smairt MT kan samarbeta med flera MT-system från tredje part via en konnektor. Du kan se det som en ”MT-ram” som kan

  • ansluta till ledande externa MT-leverantörer som Microsoft, Google, Amazon, DeepL och Yandex
  • hantera terminologi – ordlistor och listor med ord som inte ska översättas kan läggas till och uppdateras under arbetets gång för att upprätthålla godkänd terminologi och se till att den används på exakt rätt sätt i måltexter
  • tillämpa språkliga regler, så att användare kan ändra i källtexter eller det resulterande MT-materialet för att åtgärda kända fel och höja MT-kvaliteten.

Lionbridge erbjuder även andra former av automatisering för att identifiera inkonsekvenser mellan terminologi i kundordlistor och hur terminologin används i träningsdata och MT-resultat. Genom automatisering kan man enklare upptäcka fall där träningskorpus, eller MT-resultaten i ett senare steg, inte följer den godkända terminologin och rätta till dem.

Om vi ser att MT inte innehåller den terminologi som behövs föreslår vi att man använder en ordlista med ord som inte ska översättas, produktnamn och viktig terminologi som är specifik för området eller varumärket.

Har ni några andra tips på hur jag skapar och använder ordlistor?

För att uppnå önskade resultat av maskinöversättning rekommenderar vi att du utgår från följande riktlinjer när du gör dina ordlistor:

  • Ta bara med termer i ordlistor som kan användas systematiskt i alla fall då källtermen förekommer. Så är det ofta med specialiserad terminologi, ord som har godkänts av kunden samt tekniska termer.
  • Använd bara en översättningsrad i ordlistan om det finns flera översättningar av en enda källterm.
  • Använd huvudsakligen substantivfraser. Det fungerar bäst till termer med flera ord, branschtermer och kundens egna produktnamn.
  • Undvik allmänna eller vanliga termer, eftersom översättningskvaliteten kan försämras om det finns för många ord från terminologiordlistan i en mening.

Hör av dig

Om du vill lära dig mer om hur Lionbridge kan hjälpa dig att hantera din terminologi och få ut mesta möjliga av MT, kontakta oss i dag.

linkedin sharing button

Yolanda Martin med Janette Mandell
FÖRFATTARE
Yolanda Martin med Janette Mandell
  • #technology
  • #blog_posts
  • #translation_localization