AI 搭載テクノロジーを活用して、グローバルなコミュニケーションを促進しましょう。

生成系 AI
生成系 AI マーケティング ソリューション

ライオンブリッジの Language Cloud を活用して、御社の包括的なローカリゼーションとコンテンツ制作をサポート

Language Cloud™ Platform
接続性
翻訳コミュニティ
ワークフローのテクノロジー
Smart Content™
Smart MT™
Smart Data™

ライオンブリッジの誇りは社員です。20 年以上にわたって、企業が顧客の心に響くメッセージを発信できるよう支援しています。

ライオンブリッジについて
実績
経営陣
トラスト センター

言語を選択する:

Horizonal lines of varying thickness on a black background

機械翻訳と重大な誤り

自動品質チェックを導入して、翻訳の誤りによる深刻な損害を防止する

翻訳が及ぼす影響は想像以上に大きいものです。言語が何であるかにかかわらず、対象市場に効果的にリーチを拡大するには正確な翻訳が欠かせません。より多くのコンテンツをより速く翻訳し、市場へのリーチを拡大するために機械翻訳 (MT) を導入する企業がますます増えていますが、それに伴って重大な誤りを含む翻訳が拡散してしまうリスクが高まっています。

こうした問題によって企業は大きな不利益を被りかねません。MT の弱点を把握し、誤った翻訳が顧客の目に触れないようにすることがきわめて重要です。ライオンブリッジをはじめとする経験豊富な MT プロバイダーでは、人の介入を最小限に抑えつつ、MT 処理のスピードを損なわずに重大な誤りを検出することのできる自動品質チェックを翻訳工程に導入しています。

機械翻訳で生じがちな 2 つのタイプの誤りとは

昨今では MT システムのトレーニングに大量のテキストを利用できるようになっていることに加え、ニューラル ネットワークに基づくニューラル機械翻訳 (NMT) の開発が進んでいることで MT の信頼性は高まっていますが、それでも MT エンジンで誤りが生じる可能性は残されています。機械翻訳で発生しがちな誤りには主に 2 種類あり、重大さの度合いが異なります。

標準的な誤り: どのような誤りか、注意する必要はあるか

MT による標準的な誤りはより軽微なもので、対象コンテンツの言語的特徴に関連するものです。これに分類されるのは文法、スペル、句読点などの誤りです。こうした間違いはネイティブ スピーカーであれば容易に気付けるもので、これらが壊滅的な損害につながることはほとんどありません。

実際に、エンド ユーザーはこうした誤り、つまり完璧ではない訳文についてはある程度許容しているということが大規模な研究で示されています。

29 か国の消費者 8,709 名を対象に行われた調査では、以下の結果が報告されました。

  • 買い手の 65% は、コンテンツに多少の誤りがあっても、現地語でコンテンツが提供されている製品を好んで購入する。
  • ユーザーの 66% は、他の言語で提供されている製品を評価する際に、オンラインの機械翻訳を利用している。
  • 消費者の 40% は、他の言語で説明されている製品を購入しない。

(出典: 「Can’t Read, Won’t Buy — B2C」、CSA Research、2020 年 6 月

完璧な翻訳は必ずしも必要ではありません。翻訳でしばしば発生する上記のような標準的な誤りについては、過度な心配は不要です。

重大な誤りとなるのは言語上の間違いにはとどまらないタイプのもので、MT エンジンによる翻訳が原文のメッセージの意図から大きく外れてしまった場合に生じるものです。結果として生じた誤情報や誤解が、企業の評判への悪影響、財務的損失、法律上のトラブルにつながるほか、公共の安全や公衆衛生に有害な結果を招く可能性があります。

重大な誤り: どのような誤りか、なぜ注意する必要があるのか

MT による重大な誤りは文字どおり「深刻な間違い」を指すもので、こうした誤りを含む翻訳版のコンテンツが拡散されることで、企業が甚大な損害を被る可能性が生じます。

こうした誤りは言語上の間違いにとどまらないタイプのものであり、MT エンジンによる翻訳が原文のメッセージの意図から大きく逸脱した場合に発生します。翻訳版のメッセージが意図したものとは異なるものになるため、誤った情報が広まって誤解や混乱が生じ、場合によっては訴訟に発展する可能性さえあります。

たとえば、法執行機関や公衆衛生機関によって MT に起因する重大な誤りを含む指示が公開された場合、その誤った情報により市民の健康や安全に悪影響が及ぶ事態が引き起こされ、当該機関の信頼が失われるおそれがあります。企業の場合にしても、重大な誤りを含むコンテンツが拡散すれば、企業の評判への悪影響、財務的損失、法律上のトラブルにつながりかねません。

重大な誤りが発生する原因

重大な誤りは、MT エンジンの動作エラーと捉えることができます。こうしたエラーは、たとえばある 1 つの語句に意味が 2 つある場合や、原文にスペルミスがある場合など、MT エンジンが原文の文脈を理解できない状況で発生します。また、MT エンジンのトレーニング不足や使用している用語集の不備によっても、こうした誤りが繰り返し発生する可能性があります。

こうした重大な誤りが起こるのは、今日の MT エンジンがますます進化しているとはいえ、まだまだ完璧ではないためです。いまだコンピューターでは人間と同じような判断はできないのです。

高層ビルが都市を照らし出している夜景

重大な誤りが発生しやすいテキストとは

重大な誤りはさまざまな状況で発生しますが、こうした誤りを予測する上で注意すべき主なカテゴリーには、「重要な名詞の誤訳」、「否定と逆の意味」、「ハルシネーション」の 3 つがあります。

重要な名詞の誤訳

重要な名詞の誤訳とは、固有名詞 (人や組織)、重要な数、測定単位に関する翻訳上の誤りを指します。

固有名詞が関わる誤りは、人名や名称が一般名詞と同じである場合に生じることがあります。そのような人名に関する重大な誤りが、スペイン政府の Web サイトで実際にありました。ある省の公式サイトにおいて、一部署の長であった Dolores del Campo 氏の名前の代わりに、その逐語訳である「It is pain of field」(「野原の痛み」の意) と記載されていたのです。

機械翻訳エンジンは処理中に通貨単位を、たとえば円をドルに翻訳することもあるでしょう。この際に、数字の変換に適切な為替レートが反映されない可能性があります。そうなると重大な誤りが発生し、混乱を招くのみならず財政面での損害につながることも考えられます。

また、測定単位の翻訳においても間違いが発生することがあります。たとえば、医療文献で薬剤の用量がミリグラム単位で記載されているにもかかわらず、MT エンジンが誤ってそれをグラム単位として翻訳した場合、翻訳版を読んだ患者が誤った用量の薬剤を摂取してしまい、医学的に有害な結果を招く可能性があります。この場合、企業は誤りの責任を問われ、訴訟費用や損害賠償の支払いにつながるおそれがあります。

否定と逆の意味

この種の重大な誤りとは、翻訳対象の言語に、原文の意図とは逆の意味になる間違いが含まれる状況のことです。

たとえば、英語から翻訳された株主向け文書のスペイン語版に、実際には上昇した株価が「下落した」と記載されている場合などが挙げられます。

ハルシネーション

非常にまれではありますが、原文にはない内容が MT によって訳文に追加されることがあります。このような誤りを「ハルシネーション」(「幻覚症状」の意) と呼びます。この種の重大な誤りが起こる場合、通常は MT エンジン ソフトウェア自体に問題があります。場合によっては、不快な語句、下品な表現、攻撃的な表現、扱いに注意を要する表現が出力されることもあります。

暗いトンネル内でビーズのように連なるオレンジ色の光の先に明るい開口部

機械翻訳の重大な誤りを自動化によって防止するには

自社のコンテンツに以上のような重大な誤りが含まれないようにすることが重要ですが、現時点ではその実現はそう簡単ではありません。将来的に MT テクノロジーがさらに進歩してこのような誤りが生じなくなれば、企業にとってのリスクは低下しますが、現時点においては、翻訳プロセスで起こり得る問題を予め特定し、問題のある文を修正して精度を高める上で効果的な当社の自動化テクノロジーをご活用ください。

ライオンブリッジでは、プロの翻訳者が介入する「ポストエディット」プロセスを最小限に抑えつつ、MT 処理のスピードを損なわずに重大な誤りを検出できる Smairt MT™ サービスと、最先端の Smairt Content 言語 AI とを組み合わせて、翻訳済みテキストに自動品質チェックを適用することで、先述した重大な誤りを早期段階で検出します。

この自動処理では以下のような誤りが検出されます。

  • 個人名や組織名などの固有名詞の誤訳: 原文に含まれる語句から、固有名詞にも一般名詞にもなり得る語句を特定
  • 不快な語句、下品な表現、扱いに注意を要する表現: 教師ありマシン ラーニング (ML) アルゴリズムと問題のある語句のリストを組み合わせて使用
  • 原文と訳文とで意味が逆になる誤訳: 否定助詞 (たとえば英単語の not やその短縮形 n’t) を含む文が、原文 (英語) と訳文の両方にではなく一方だけに含まれているケースを特定
  • 訳文中のハルシネーションに起因する語句: 辞書を使用して検出。侮辱的な語句が混入するケースは問題のある語句のリストを使用して検出 

ただし、自動品質チェックで重大な誤りを 100% 防ぐことはできないことに注意してください。自動チェックが誤りを検出できず、偽陰性を含む結果となることもあります。それでもなお、問題箇所を特定する上で自動品質チェックは非常に効果的です。このアプローチを採用することで、翻訳者は要注意として検出された文に集中でき、文書全体の再チェックが不要になります。翻訳者に問題の起こりそうな箇所への注意を促すことで、ローカリゼーション プロセスの効率が向上します。

お問い合わせ

重大な誤りから御社を保護する MT 戦略の導入や当社の支援サービスについてご興味があれば、ぜひ当社までお問い合わせください。

linkedin sharing button

ルイス ハビエル サンティアゴ、ジャネット マンデル
AUTHOR
ルイス ハビエル サンティアゴ、ジャネット マンデル
  • #blog_posts
  • #translation_localization