ライオンブリッジの誇りは社員です。20 年以上にわたって、企業が顧客の心に響くメッセージを発信できるよう支援しています。

ライオンブリッジについて
実績
経営陣
インサイト
ニュース
トラスト センター

ライオンブリッジの Lainguage Cloud を活用して、御社の包括的なローカリゼーションとコンテンツ制作をサポート

Lainguage Cloud™ Platform
接続性
翻訳コミュニティ
ワークフローのテクノロジー
Smairt Content™
Smairt MT™
Smairt Data™

言語を選択する:

ライオンブリッジ機械翻訳トラッカー

お客様のニーズに応じた最適な機械翻訳エンジン選びにライオンブリッジの評価ツールをお役立てください

はじめに

機械翻訳 (MT) テクノロジーには長い歴史がありますが、とりわけ近年の急速な進歩には目覚ましいものがあります。かつてない量のコンテンツがさまざまな言語で生み出されている現在、グローバリゼーションが進む中で世界にリーチを確実に広げる手段として、機械翻訳の活用に企業からの注目が集まっています。 

機械翻訳の導入をお考えの際は、以下の 4 つの基本的なアプローチからいずれかをお選びいただけます。 

パブリック MT

Google 翻訳や Bing 翻訳など、一般向けに公開されている機械翻訳サービスの利用。誰でも無料で利用できる反面、用語集のカスタマイズなどの高度な機能は搭載されていません。また、データが他のサービスに流用される懸念もあります。 

オンサイト MT

自社の IT 環境内に機械翻訳サーバーを設置して運用する方法です。非常に強固なセキュリティを実現できる反面、コストがかさみ、煩雑な導入・運用作業と継続的なメンテナンスが必要になります。

クラウド MT

パブリック MT と仕組みが似ており、MT はクラウド上でホストされますが、御社専用の MT インスタンスを作成します。御社から MT サービスに送られるデータのセキュリティはしっかりと確保され、第三者に開示されることはありません。用語集のカスタマイズに関連する高度な機能をはじめ、さまざまなメリットが見込める反面、ベンダーによる囲い込み (ロックイン) が生じて、言語ペアの組み合わせによっては機械翻訳の品質が期待値を下回ることもあります。 

ベスト オブ ブリード MT

1 つのプラットフォーム上で複数の機械翻訳エンジンを運用できます。用語集のカスタマイズを一元化する機能、管理しやすいインターフェイスなどに加え、言語ペアやコンテンツの種類に応じて最良のエンジンを組み合わせて選択できる利便性の高さを特徴とします。

どのアプローチを採用するにせよ、御社に適したエンジン選びは容易ではなく、適切なデータと経験を踏まえて判断する必要があります。その点、ライオンブリッジは機械翻訳の分野で 20 年以上の経験を誇り、機械翻訳テクノロジーに関する膨大な言語データと品質データを蓄積しているエキスパートです。御社が適切な判断を下せるよう、あらゆる面でお手伝いいたします。この Web ページでは、よく利用される言語ペアについて、機械翻訳エンジンの性能に関する基本的な情報を提供しています。皆さまのコンテンツに合った最良の選択をしていただくためにご活用ください。 

最も優れた機械翻訳エンジンは一体どれなのでしょうか。 簡単な答えはありません。


数多くの機械翻訳エンジンの中から選択するときには、特定のエンジンは特定の機能や分野に長けているという点に留意することが重要です。 御社のニーズと機械翻訳エンジンの特徴や用途が一致しないと、どれだけ優れたエンジンであったとしても、その能力を十分には発揮できません。 最適なオプションを見極めるには、まずはなぜ機械翻訳を利用するのかを明確にします。

全般的な用途で機械翻訳エンジンを使用したいのであれば、Google Translate や Bing Translator を使用するのが適切でしょう。 特定の言語や分野に対応した機械翻訳サービスを必要としているのであれば、Amazon Translate または DeepL Translator を使用することで、よりよい結果が得られるでしょう。

ライオンブリッジの機械翻訳トラッカーなら、月ごとのパフォーマンス分析を通じて、御社で利用する言語ペアに最適な機械翻訳エンジンを特定することが可能です。 次に「最も優れた機械翻訳エンジンはどれか」という質問をするときは、「私にとって最適な機械翻訳エンジンはどれか」と言い換えて質問してみてください。そしてその答えを導き出せるのは当社ライオンブリッジです。ぜひ当社までお問い合わせください。

各種の機械翻訳テクノロジーについて詳しく知りたい方は、当社のブログ「機械翻訳の説明」をご覧ください。

ライオンブリッジのエキスパートからのコメント

2023 年 10 月

生成系 AI (GenAI)/大規模言語モデル (LLM) の普及と将来性を踏まえ、当社はライオンブリッジ機械翻訳 (MT) 品質トラッカー レポートを強化しました。 今後、レポートにはニューラル MT (NMT) エンジンのパフォーマンスはもちろん、GPT-3.5 と Davinci の結果に加え、GPT-4 による翻訳結果も含まれるようになります。

最新の調査結果や、 GPT-4 の特筆すべき特性をいくつかご紹介します。

GPT-4 に関連する複数の問題が見られており、低パフォーマンス、さまざまな理由により翻訳を出力できない現象、実行するたびに訳文が入ったり、入らなかったりする一貫性のない動作などが挙げられます。

調査結果 1 — GPT-4 で一部のテキストが翻訳されない。

当社の MT テスト セットにおいて、GPT-4 で特定の文章が翻訳されない現象が見られました。

調査の結果、特定の文脈において性的な意味合いを持つ用語が、この問題を引き起こしていることがわかりました。 誤解のないように言うと、当社が用意したテスト セットの文章は標準的でまったく問題のない内容でした。 それにもかかわらず、GPT-4 の性的コンテンツ フィルターがその特定の用語に反応し、AI によってその文章の訳文が検閲されて、結果として訳文が出力されなかったようです。 この結果が驚きであったのには、次の 2 つの理由があります。

この用語が一般的な使用法で個別に使われている場合、問題は発生していない。

その特定の文章の文脈に問題のある解釈はない。

この観測の結果、GPT-4 のフィルター処理メカニズムの一部が、曖昧な用語も含む、シンプルな禁止用語のリストに基づいて構築されていることが原因である可能性が高いという結論に至りました。 これは過度に反応し、プロフェッショナルな翻訳において重大な問題である誤検出を引き起こしやすいため、問題のあるアプローチと言えます。

ニューラル MT エンジンといったこれまでの機械翻訳テクノロジーでは、このようなコンテンツ フィルター処理の問題は見られなかったため、これは LLM テクノロジーの制約だと結論付けることができます。

この制約は、現実世界のさまざまな場面で影響を及ぼすでしょう。 たとえば、婦人科や性教育に関連する医学的コンテンツを翻訳する必要がある場合を考えてみましょう。 LLM で一部のテキストが翻訳されない状況にあわてることになるかもしれません。

興味深いことに、この問題は文章を中国語に翻訳する場合のみに発生し、他の言語への翻訳時には発生しませんでした。 この結果は、GPT-4 の出力側にフィルターが適用されていることを示しています。 解決策として、翻訳タスクのコンテンツ フィルターを無効にすることが挙げられます。

調査結果 2 — GPT-4 の出力結果にばらつきが見られる。

5 週間にわたって追跡を行った結果、LLM 機械翻訳、特に GPT-4 の出力結果に大きなばらつきが見られました。

生成系 AI においてもこの結果は想定されていましたが、ばらつきが予想よりも大きく、「温度」や「最上位確率」(Top_p) のパラメータ設定を使って創造性の度合いを下げ、出力の決定性を高めた場合でも見られました。 GPT の実行ごとに異なる翻訳出力が生成され、これは連続して翻訳を実行した場合でも同様でした。

どちらの訳文も、異なってはいても許容範囲内である場合はあるものの、 これまでのニューラル MT パラダイムとは異なる、制御が必要な要素であることには変わりありません。

NMT から LLM MT への移行というこの潜在的なパラダイム シフトでは、テクノロジーの変化だけでなく、考え方の変化も必要になると直感しています。 同じ入力と同じパラメータを使用した場合でも、決定性の低い出力を容認する心構えをし、現在の自動化で見られるよりも大きなばらつきが見られることを想定しておく必要があるかもしれません。

ある程度の不確定要素は容認する必要はありそうですが、何らかのメカニズムやベスト プラクティスを活用して、そのばらつきをいくらか制御できるようにすることも可能だと考えられます。

最後に、図に示しているように、GPT-4 の編集距離の評価の低下は、品質の低下を示しているわけではありません。 単に GPT 出力のばらつきが反映された結果です。 来月は評価が上がっている可能性もあります。 開発の余地やさらなるインサイトについて、ぜひご期待ください。

 

    —ラファ モラル、ライオンブリッジ、イノベーション担当バイス プレジデント

エキスパートのこれまでの解説を読むには、ここをクリックしてください。

MT パフォーマンス全体の評価
MT エンジンの比較
時間
各言語ペアの品質
ドイツ語、スペイン語、ロシア語、または中国語をドロップダウン メニューから選択してください
時間
各ドメインのパフォーマンス
ドロップダウン メニューで分野/主題を選択してください
時間

機械翻訳に関するインサイトや将来のトレンドについて興味のある方は、当社のブログ「言語テクノロジーの未来: 機械翻訳の未来」をご覧ください。

ライオンブリッジ機械翻訳トラッカーの調査手法

当社では、機械翻訳のスコア判定において「逆編集距離」と呼ばれる手法を採用しています。人間の手によるポスト エディット作業で修正された文字数 (アジア諸言語の場合) またはワード数 (西洋諸言語の場合) に基づいた「編集距離」を品質の尺度として利用し、修正前後の訳文間の差異を評価します。この指標は、数値が大きければ大きいほど最終的な品質が優れていることを意味します。

評価対象とした 4 つの機械翻訳エンジンのうち、Google と Bing NMT は、一般的なコンテンツと各種の言語ペアにおいて最良の性能を発揮しています。一方、ドイツ語に関しては DeepL が最も強く、中国語では Amazon の品質が良いというように、特定の言語ペアについて突出した強みを見せるエンジンもあります。

免責事項

  1. 本レポートにおける機械翻訳エンジンの評価はライオンブリッジが月に一度実施しているものです。
  2. 掲載データは説明のみを目的としたものであり、個別のケースについてはそれぞれ異なる取り扱いと評価が必要になります。
  3. 本レポートの作成にあたっては、ライオンブリッジの複数の機械翻訳チームによって事前に選定されたソース データを使用しています。機械翻訳エンジン間の比較では、それぞれの機械翻訳エンジンおよび言語ペアについて同じソース データを毎回使用しています。
  4. 本レポートの作成にあたり、お客様のデータはいっさい使用していません。

Smaⁱrter™ でスマートに MT を活用

Smaⁱrt MT™: デジタル時代の機械翻訳 (MT)

機械翻訳を活用して現地語でデジタル エクスペリエンスを提供し、顧客満足度を向上させ、グローバル市場で優位性を確立する方法をお確かめください。

言語テクノロジーの未来: 機械翻訳の未来

機械翻訳は進化し続けており、適切に運用すれば翻訳の生産性において重要な役割を果たします。

機械翻訳 vs. 機械翻訳 + ポストエディット

機械翻訳のみで十分な場合や、翻訳者とのハイブリッド モデルを採用すべき場合など、さまざまなケースについて説明します。 

ニューラル機械翻訳: 翻訳において人工知能 (AI) が果たす役割

ニューラル機械翻訳とは何か、そしてニューラル機械翻訳が言語サービス業界を一変させる可能性について詳しく説明します。

機械翻訳の説明

機械翻訳に関わる重要な用語について、わかりやすくまとめています。 

以下の画像をクリックして、機械翻訳を理解するための主な定義をご覧ください。

お問い合わせ