Vi är stolta över våra medarbetare som hjälpt företag att kommunicera med sina kunder i över 20 år.

Om oss
Viktiga fakta
Ledarskap
Insikter
Nyheter
Trust Center

Utnyttja kraften hos Lionbridge Lainguage Cloud för att hantera lokalisering och innehållets hela livscykel

Lainguage Cloud™ Plattform
Anslutning
Translation Community
Arbetsflödesteknik
Smairt Content™
Smairt MT™
Smairt Data™

VÄLJ SPRÅK:

Lionbridges bedömningsverktyg för maskinöversättning

Här presenterar vi vårt bedömningsverktyg som hjälper dig att välja den bästa maskinöversättningsmotorn för dina behov

Inledning

Maskinöversättning (MT) har funnits i många år, men på senare år har tekniken utvecklats exponentiellt. I takt med att företagen producerar en ständigt ökande mängd innehåll på olika språk har de börjat se maskinöversättning som en väg till utökad räckvidd i en alltmer globaliserad värld. 

Företag som vill använda maskinöversättning har fyra grundläggande strategier att utforska: 

Offentlig MT

Användning av tjänster som Google eller Bing Translate. Dessa tjänster är tillgängliga för alla kostnadsfritt, men de saknar mer avancerade funktioner, som kundanpassning av terminologi, och data kan komma att återanvändas i andra tjänster. 

Lokal MT

Denna strategi kräver att företaget använder en maskinöversättningsserver i sina IT-miljöer. Säkerheten är mycket hög, men strategin medför en betydande kostnad, är komplex att använda och hantera samt kräver löpande underhåll.

MT i molnet

Fungerar på ett liknande sätt som offentlig MT och finns i molnet, men skapar en egen instans för företaget. Alla data som delas med tjänsten skyddas och delas inte med någon utomstående. Den erbjuder tilläggsfunktioner för terminologi och andra fördelar, men kan resultera i en beroendeställning till leverantören och en inte helt optimal maskinöversättningskvalitet över flera språkkombinationer. 

Förstklassig MT

En enda plattform som ger möjlighet att hantera flera maskinöversättningsmotorer och erbjuder ett enkelt lager av terminologisk kundanpassning, ett lätthanterat gränssnitt samt möjlighet att välja de bästa motorerna för olika språkkombinationer och innehållstyper.

Oavsett vilken strategi de väljer kan det vara svårt att välja rätt motor utan korrekta data och kunskaper. Med över 20 års erfarenhet är Lionbridge expert på maskinöversättning och har samlat en stor mängd språk- och kvalitetsdata om maskinöversättningsteknik som kan vara till hjälp i valet av rätt motor. Den här webbsidan ger grundläggande information om maskinöversättningsmotorer för de vanligast förekommande språkkombinationerna för att hjälpa företag att göra det bästa valet för sitt innehåll. 

Vilken är den bästa maskinöversättningsmotorn? Den frågan har inget enkelt svar.


När du väljer bland marknadens alla maskinöversättningssystem är det viktigt att komma ihåg att vissa motorer är avsedda att användas till en viss funktion eller inom ett särskilt område. Om du har andra behov än det tänkta ändamålet kan det hända att motorn inte fungerar optimalt, oavsett hur sofistikerad den är. För att kunna välja det bästa alternativet behöver du därför först ta reda på varför du tänker använda maskinöversättning.

Om du vill ha en maskinöversättningsmotor för allmänt bruk kan det passa bra att använda Google Translate eller Bing Translator. Om du efterfrågar maskinöversättningstjänster för ett visst språk eller område kan du uppnå bättre resultat genom att vända dig till Amazon Translate eller DeepL Translator.

Lionbridges bedömningsverktyg för maskinöversättning analyserar motorernas resultat varje månad för att hjälpa dig att hitta den bästa maskinöversättningsmotorn för den språkkombination du arbetar med. Så nästa gång du undrar vilken maskinöversättningsmotor som är bäst, kan du i stället fråga: ”Vilken maskinöversättningsmotor passar bäst för mig?” Och räkna med att Lionbridge kan leda dig rätt.

Vill du lära dig mer om olika typer av maskinöversättningstekniker? Läs vår blogg Machine Translation in Translation.

Lionbridges expertkommentar

Oktober 2023

Vi har förbättrat Lionbridges bedömningsverktyg för maskinöversättning för att ta hänsyn till förekomsten av och potentialen hos generativ AI (GenAI) och stora språkmodeller (LLM). Från och med nu kommer rapporten förutom resultat från GPT-3.5 och Davinci även innehålla översättningsresultat från GPT-4 – och naturligtvis resultat från neurala MT-motorer (NMT).

Vilka nya upptäckter har ni gjort på sistone? Vissa intressanta egenheter hos GPT-4.

Vi har upplevt flera problem i samband med GPT-4, bland annat långsam prestanda, oförmåga att producera översättningar av olika anledningar samt inkonsekvent beteende, exempelvis att översättningar saknas i vissa körningar men inte andra.

Upptäckt 1: GPT-4 klarar inte av att översätta viss text.

GPT-4 klarade inte av att översätta en viss mening i vår MT-testuppsättning.

Efter lite efterforskningar drog vi slutsatsen att en term med sexuella associationer i vissa sammanhang orsakade problemet. Vi vill vara tydliga med att meningen i vår testuppsättning var en helt vanlig och godtagbar mening. Trots detta utlöste termen GPT-4:s filter för innehåll av sexuell karaktär, vilket ledde till att AI:n censurerade översättningen av meningen och därmed inte producerade något alls. Resultatet överraskade oss av två anledningar:

När termen användes isolerat och på det sätt den brukar uppstod inte några problem.

Sammanhanget för just den här meningen kunde inte tolkas på något problematiskt sätt.

Observationen fick oss att dra slutsatsen att en del av filtreringsmekanismen i GPT-4 kanske bygger på en enkel lista med förbjudna ord som även innehåller tvetydiga termer. Den här metoden är problematisk, eftersom den riskerar att angripa för brett och ge falskt positiva resultat, vilket är ett allvarligt problem vid professionell översättning.

Tidigare maskinöversättningsteknik, till exempel neurala MT-motorer, har inte den här sortens problem med innehållsfiltrering. Därför kan vi anta att det är en begränsning hos LLM-tekniken.

Begränsningen får konsekvenser i verkliga scenarier. Tänk dig till exempel att du behöver översätta medicinskt innehåll om gynekologi eller sexualupplysning. Då blir du kanske överraskad om LLM inte översätter delar av texten.

En intressant aspekt är att vi bara noterade problemet när meningen översattes till ett visst språk, kinesiska, men inte när vi översatte den till andra språk. Resultatet visar att filtret användes på måltexten från GPT-4. Lösningen är att stänga av innehållsfiltren vid översättningsuppgifter.

Upptäckt 2: GPT-4 ger varierande resultat.

Efter att ha följt maskinöversättningsresultat från LLM i fem veckor upptäckte vi att de varierade kraftigt, i synnerhet med GPT-4.

Även om vi förväntade oss de här resultaten från generativ AI var variationen större än vi hade räknat med – även när vi använde Top_p-parameterinställningar (Temperature and Top Probability) för att göra resultatet mindre kreativt och mer förutsägbart. Översättningsresultatet skilde sig åt i varje enskild GPT-omgång vi körde, även när vi utförde översättningarna direkt efter varandra.

Även om översättningarna är olika kan båda två vara godtagbara. Trots detta är det här ännu en aspekt som behöver kontrolleras och ytterligare en skillnad jämfört med det tidigare neurala MT-paradigmet.

Vi börjar ana att det här potentiella paradigmskiftet – från NMT till LLM MT – kanske inte bara består av en teknisk förändring, utan också ställer krav på att vi själva ändrar synsätt: Det kan hända att vi behöver lära oss att leva med mindre förutsägbara resultat, även när vi använder exakt samma källtext och parametrar. Vi kanske också får acceptera större variation än vi är vana vid med dagens automatisering.

I viss mån kan vi därmed bli tvungna att godta större ovisshet, men vi kan ändå använda vissa mekanismer och bra metoder för att se till att variationen blir någorlunda kontrollerbar.

Slutligen: När du studerar vårt diagram, observera att det ökade redigeringsavståndet för GPT-4 inte betyder att kvaliteten har sjunkit. Det beror på att GPT-resultaten är så varierande. Nästa månad kanske linjen går upp. Håll utkik här för att ta del av fler insikter och framsteg.

 

    —Rafa Moral, Lionbridge Vice President, Innovation

Klicka här för att läsa tidigare expertkommentarer.

Bedömning av generell maskinöversättningsprestanda
Jämförelse av maskinöversättningsmotorer
Tid
Efter språkparskvalitet
Välj mellan tyska, spanska, ryska och kinesiska i listrutan
Tid
Prestanda efter ämnesområde
Välj område/ämne i listrutan
Tid

Om du vill ta del av fler insikter och framtidstrender gällande maskinöversättning kan du läsa vårt blogginlägg Språkteknologins framtid  – Maskinöversättningens framtid.

Lionbridges spårningsmetod för maskinöversättning

Lionbridge använder omvänt redigeringsavstånd som bedömningsmodell. Redigeringsavstånd är ett mått på skillnaden mellan översättningar mätt i det antal tecken (för asiatiska språk) eller ord (för västerländska språk) som behöver ändras under den manuella efterredigeringen. Ju högre värde desto bättre kvalitet.

Av de fyra maskinöversättningsmotorer vi utvärderade uppvisade Google och Bing NMT den bästa prestandan för olika språkkombinationer med allmänt innehåll. Men för vissa språkkombinationer fungerar mer specialiserade motorer bäst: DeepL har bäst prestanda för tyska och Amazon är bäst på att översätta kinesiska.

Ansvarsfriskrivning

  1. Maskinöversättningsmotorerna i den här rapporten utvärderas varje månad av Lionbridge.
  2. De data som tillhandahålls är avsedda som illustration och varje fall bör behandlas och utvärderas individuellt.
  3. Den här rapporten är framtagen baserat på förvalda källdata från Lionbridges maskinöversättningsteam. Varje gång skickas samma källdata till varje maskinöversättningsmotor och språkkombination, vilket gör det möjligt att jämföra översättningsmotorerna.
  4. Inga kunddata har använts i framtagandet av den här rapporten.

Smartare MT med Smaⁱrter™

Smaⁱrt MT™: Maskinöversättning för den digitala tidsåldern

Ta reda på hur du kan använda maskinöversättning för att erbjuda digitala upplevelser på lokala språk, uppnå bättre kundnöjdhetssiffror och lyckas på globala marknader.

Språkteknikens framtid: Maskinöversättningens framtid

Maskinöversättning kommer att fortsätta utvecklas och bli allt viktigare för översättningsproduktiviteten om den används på rätt sätt.

Maskinöversättning jämfört med maskinöversättning med efterredigering

När är det bäst att förlita sig på maskinöversättning? När bör du överväga en hybridmodell som innehåller traditionell manuell översättning? Vi går igenom scenarierna. 

Neural maskinöversättning: så här fungerar artificiell intelligens vid översättning

Lär dig mer om neural maskinöversättning och varför det anses vara en avgörande förändring för språkbranschen. 

Maskinöversättning vid översättning

Med den här behändiga översikten får du koll på de viktigaste termerna inom maskinöversättning. 

Se nyckeldefinitioner inom maskinöversättning genom att klicka på bilden nedan

Kontakta oss