ライオンブリッジの誇りは社員です。20 年以上にわたって、企業が顧客の心に響くメッセージを発信できるよう支援しています。

ライオンブリッジについて
経営陣
インサイト
ニュース
インサイト
実績

ライオンブリッジの専門家は、お客様の業界とその課題を隅々まで理解しています。

ライフ サイエンス
銀行/金融
リテール
Eコマース
Lionbridge Games
自動車
消費財
テクノロジー
製造業
法務関連
旅行/ホスピタリティ

ライオンブリッジの Lainguage Cloud を活用して、御社の包括的なローカリゼーションとコンテンツ制作をサポート

Lainguage Cloud™ Platform
接続性
翻訳コミュニティ
ワークフローのテクノロジー
Smairt Content™
Smairt MT™
Smairt Data™

言語を選択する:

ライオンブリッジ機械翻訳トラッカー

お客様のニーズに応じた最適な機械翻訳エンジン選びにライオンブリッジの評価ツールをお役立てください

はじめに

機械翻訳 (MT) テクノロジーには長い歴史がありますが、とりわけ近年の急速な進歩には目覚ましいものがあります。かつてない量のコンテンツがさまざまな言語で生み出されている現在、グローバリゼーションが進む中で世界にリーチを確実に広げる手段として、機械翻訳の活用に企業からの注目が集まっています。 

機械翻訳の導入をお考えの際は、以下の 4 つの基本的なアプローチからいずれかをお選びいただけます。 

パブリック MT

Google 翻訳や Bing 翻訳など、一般向けに公開されている機械翻訳サービスの利用。誰でも無料で利用できる反面、用語集のカスタマイズなどの高度な機能は搭載されていません。また、データが他のサービスに流用される懸念もあります。 

オンサイト MT

自社の IT 環境内に機械翻訳サーバーを設置して運用する方法です。非常に強固なセキュリティを実現できる反面、コストがかさみ、煩雑な導入・運用作業と継続的なメンテナンスが必要になります。

クラウド MT

パブリック MT と仕組みが似ており、MT はクラウド上でホストされますが、御社専用の MT インスタンスを作成します。御社から MT サービスに送られるデータのセキュリティはしっかりと確保され、第三者に開示されることはありません。用語集のカスタマイズに関連する高度な機能をはじめ、さまざまなメリットが見込める反面、ベンダーによる囲い込み (ロックイン) が生じて、言語ペアの組み合わせによっては機械翻訳の品質が期待値を下回ることもあります。 

ベスト オブ ブリード MT

1 つのプラットフォーム上で複数の機械翻訳エンジンを運用できます。用語集のカスタマイズを一元化する機能、管理しやすいインターフェイスなどに加え、言語ペアやコンテンツの種類に応じて最良のエンジンを組み合わせて選択できる利便性の高さを特徴とします。

どのアプローチを採用するにせよ、御社に適したエンジン選びは容易ではなく、適切なデータと経験を踏まえて判断する必要があります。その点、ライオンブリッジは機械翻訳の分野で 20 年以上の経験を誇り、機械翻訳テクノロジーに関する膨大な言語データと品質データを蓄積しているエキスパートです。御社が適切な判断を下せるよう、あらゆる面でお手伝いいたします。この Web ページでは、よく利用される言語ペアについて、機械翻訳エンジンの性能に関する基本的な情報を提供しています。皆さまのコンテンツに合った最良の選択をしていただくためにご活用ください。 

最も優れた機械翻訳エンジンは一体どれなのでしょうか。 簡単な答えはありません。


数多くの機械翻訳エンジンの中から選択するときには、特定のエンジンは特定の機能や分野に長けているという点に留意することが重要です。 御社のニーズと機械翻訳エンジンの特徴や用途が一致しないと、どれだけ優れたエンジンであったとしても、その能力を十分には発揮できません。 最適なオプションを見極めるには、まずはなぜ機械翻訳を利用するのかを明確にします。

全般的な用途で機械翻訳エンジンを使用したいのであれば、Google Translate や Bing Translator を使用するのが適切でしょう。 特定の言語や分野に対応した機械翻訳サービスを必要としているのであれば、Amazon Translate または DeepL Translator を使用することで、よりよい結果が得られるでしょう。

ライオンブリッジの機械翻訳トラッカーなら、月ごとのパフォーマンス分析を通じて、御社で利用する言語ペアに最適な機械翻訳エンジンを特定することが可能です。 次に「最も優れた機械翻訳エンジンはどれか」という質問をするときは、「私にとって最適な機械翻訳エンジンはどれか」と言い換えて質問してみてください。そしてその答えを導き出せるのは当社ライオンブリッジです。ぜひ当社までお問い合わせください。

各種の機械翻訳テクノロジーについて詳しく知りたい方は、当社のブログ「機械翻訳の説明」をご覧ください。

ライオンブリッジのエキスパートからのコメント

2023 年 2 月

汎用型の機械翻訳 (MT) エンジンは、翻訳プロセスを自動化したい企業にとって十分な結果を提供することが多くあります。 ですが、質の低い訳を提案することもあります。コンテンツが技術的なものであったり、高度に専門的なものであったりする場合は特にです。

具体的な目的を達成するために機械翻訳 (MT) の品質を改善したいと考えている企業は、 MT のカスタマイズかトレーニング、あるいはその両方を実施する選択肢があります。 どちらの方法も、あるいは両方を組み合わせた場合も、自動化された翻訳プロセスにおいてより優れた結果を得られるようになります。

ただし、それぞれのアプローチは互いに異なるものであり、どちらを採用しても変わりがない、というものではありません。 表 1 は、MT のカスタマイズおよび MT のトレーニングに関する概要とそれぞれの方法を評価する際に検討すべき事項を示しています。

機械翻訳のカスタマイズと機械翻訳のトレーニングの比較

  MT のカスタマイズ MT のトレーニング
定義としくみ 機械翻訳が生成する翻訳の精度を高めるために、既にある機械翻訳エンジンを、用語集や翻訳しない語句 (DNT) リストと併せて採用すること 機械翻訳が生成する翻訳の精度を高めるために、コーパスの豊富なバイリンガル言語データを活用して MT エンジンを構築およびトレーニングすること
達成される内容 MT が提案する翻訳をより正確にし、ポストエディットの必要性を低減する MT が提案する翻訳をより正確にし、ポストエディットの必要性を低減する
具体的な利点 適切なブランド名や用語を使用して地域別のバリエーションを用意できるようになる 企業独自のブランド ボイス、トーン、スタイルを維持しながら、地域別のバリエーションを用意できるようになる
使用上のリスク 適切に実行されないと MT が提案する翻訳の質が低く、全体的な品質を損なう可能性がある エンジンをトレーニングするために必要な質の高いデータが十分にない場合、MT のトレーニングの成果を得ることができない可能性がある。経験のない作成者がコンテンツで用語を多用しすぎると、MT によって品質レベルの低い翻訳が提示され、全体の品質を損ねる可能性がある。
使用するタイミング 技術的なコンテンツや細部を重視するコンテンツ、および次のことが当てはまるコンテンツに理想的な選択肢
*用語を正確に翻訳する必要がある
* 地域別のバリエーションを用意する必要があるものの、MT のトレーニングを実施するには十分なデータがない
専門性の高いコンテンツ、マーケティングやクリエイティブなコンテンツ、および次のことが当てはまるコンテンツに理想的な選択肢
*独自のブランド ボイスやトーン、スタイルを維持する必要がある
*地域別のバリエーションを用意する必要があり、MT のトレーニングを実施するための十分なデータがある
成功要因 インプットとアウトプットの標準化ルール、用語集、および DNT を適切に管理できる、経験ある MT エキスパート エンジンを十分にトレーニングするために必要な少なくとも 15,000 のユニークなセグメント
コスト上の検討事項 MT エンジンに設定するプロファイルをアップデートするための 1 回限りの費用と、用語集を維持・管理するための費用が継続的にかかる。潜在的な利点を考慮すると比較的安価。また、一般的には MT のトレーニングにかかる費用よりも安価で済む 初回のトレーニングにかかる費用に加え、MT のパフォーマンスをモニタリングする中で改善の余地があると見受けられる場合に追加のトレーニング費用がかかる可能性がある。潜在的な利点を考慮した場合に、特定のケースで投資の価値がある

表 1. MT のカスタマイズと MT のトレーニングの比較

機械翻訳のカスタマイズと機械翻訳のトレーニングの比較について詳しくは、当社のブログ記事をお読みください。

 

    —トーマス マッカーシー、ライオンブリッジ MT ビジネス アナリスト

2023 年 1 月

機械翻訳 (MT) において、大規模言語モデル (LLM) がニューラル機械翻訳 (NMT) に取って代わるパラダイム シフトが起こるのでしょうか。 これを確かめるために、OpenAI の LLM である GPT-3 ファミリーの最新バージョン ChatGPT と、MT 品質トラッキングで当社が利用している 5 つの主要 MT エンジンとで、翻訳パフォーマンスを比較しました。

予想どおり、特化型 NMT エンジンのほうが ChatGPT よりも翻訳は優れていました。 しかし、驚くべきことに、ChatGPT のパフォーマンスも立派なものでした。 図 1 に示すように、ChatGPT は特化型エンジンに匹敵する結果を残しました。

品質レベルは、英語からスペイン語に翻訳する言語ペアの複数の参照訳を使用して、逆編集距離に基づいて算出しました。 編集距離は、MT の出力に対して、翻訳者による翻訳品質と同等にするために人間が行わなければならない編集の量を算出するものです。 今回は、翻訳者による翻訳 1 種類のみではなく、10 種類、つまり複数の参照訳と MT のみの出力を比較しました。 逆編集距離は、結果の数値が大きいほど品質が優れていることを意味します。

図 1. 英語からスペイン語に翻訳する言語ペアの複数の参照訳を使用した逆編集距離に基づく、ChatGPT と主要機械翻訳エンジンによる自動翻訳品質の比較。

これらの結果は目を見張るものです。というのも、汎用モデルは自然言語処理 (NLP) タスクを実行するようトレーニングされており、特に翻訳実行のためのトレーニングはされていないからです。 ChatGPT のパフォーマンスは、2 ~ 3 年前の MT エンジンの品質レベルと同等です。

世間の関心とこの技術への IT 企業の大型投資を踏まえて LLM の進化を考えると、ChatGPT が MT エンジンを追い越すかどうか、または MT が新しい LLM のパラダイムを採用するようになるかどうかがわかるまでにそれほど時間はかからないかもしれません。 MT が LLM をベースとして使用する可能性はありますが、その時は機械翻訳向けにテクノロジーのチューニングが行われる可能性があります。 これは、機械と人間の会話によるコミュニケーションを可能にするといった特定のユース ケース向けに汎用モデルを向上させるべく、OpenAI や他の LLM 企業が行っていることと同様のことです。 特化することで、実行するタスクの精度が高まります。

これらの大規模言語「汎用」モデルの良い点の一つは、さまざまなことを実行でき、それらのタスクのほとんどで優れた品質を示せることです。 たとえば、DeepMind の GATO は別の汎用 AI モデルですが、600 以上のタスクでテストされ、うち 400 で「現時点での最先端レベル (SOTA: State-of-the-Art)」という結果を示しました。

GPT、Megatron、GATO のような汎用モデルと、これらの汎用モデルをベースに特定の目的のために特化したモデルという 2 つの開発ラインは今後も存続するでしょう。 汎用モデルは、汎用人工知能 (AGI) を進化させる上で、そしておそらくは長期的な、より目覚ましい発展を進める上で重要です。 そして特化型モデルは、特定の分野で短期的に実用化されるでしょう。 LLM で注目すべきことの一つは、両方のラインが並行して進化し、機能できることです。

今後どうなるか、興味がそそられます。 引き続き LLM を評価し、結果を公開することで、皆さまにこの心躍る進化の最新情報をお届けします。ChatGPT の翻訳パフォーマンスについて掘り下げた記事、またChatGPT とローカリゼーション、ChatGPT が変革をもたらすと考えられる理由を詳しく説明した記事を公開していますので、ぜひ当社のブログ記事をご覧ください。

 

    —ラファ モラル、ライオンブリッジ、イノベーション担当バイス プレジデント

エキスパートのこれまでの解説を読むには、ここをクリックしてください。

MT パフォーマンス全体の評価
MT エンジンの比較
時間
各言語ペアの品質
ドイツ語、スペイン語、ロシア語、または中国語をドロップダウン メニューから選択してください
時間
各ドメインのパフォーマンス
ドロップダウン メニューで分野/主題を選択してください
時間

機械翻訳に関するインサイトや将来のトレンドについて興味のある方は、当社のブログ「言語テクノロジーの未来: 機械翻訳の未来」をご覧ください。

ライオンブリッジ機械翻訳トラッカーの調査手法

当社では、機械翻訳のスコア判定において「逆編集距離」と呼ばれる手法を採用しています。人間の手によるポスト エディット作業で修正された文字数 (アジア諸言語の場合) またはワード数 (西洋諸言語の場合) に基づいた「編集距離」を品質の尺度として利用し、修正前後の訳文間の差異を評価します。この指標は、数値が大きければ大きいほど最終的な品質が優れていることを意味します。

評価対象とした 4 つの機械翻訳エンジンのうち、Google と Bing NMT は、一般的なコンテンツと各種の言語ペアにおいて最良の性能を発揮しています。一方、ドイツ語に関しては DeepL が最も強く、中国語では Amazon の品質が良いというように、特定の言語ペアについて突出した強みを見せるエンジンもあります。

免責事項

  1. 本レポートにおける機械翻訳エンジンの評価はライオンブリッジが月に一度実施しているものです。
  2. 掲載データは説明のみを目的としたものであり、個別のケースについてはそれぞれ異なる取り扱いと評価が必要になります。
  3. 本レポートの作成にあたっては、ライオンブリッジの複数の機械翻訳チームによって事前に選定されたソース データを使用しています。機械翻訳エンジン間の比較では、それぞれの機械翻訳エンジンおよび言語ペアについて同じソース データを毎回使用しています。
  4. 本レポートの作成にあたり、お客様のデータはいっさい使用していません。

Smaⁱrter™ でスマートに MT を活用

Smaⁱrt MT™: デジタル時代の機械翻訳 (MT)

機械翻訳を活用して現地語でデジタル エクスペリエンスを提供し、顧客満足度を向上させ、グローバル市場で優位性を確立する方法をお確かめください。

言語テクノロジーの未来: 機械翻訳の未来

機械翻訳は進化し続けており、適切に運用すれば翻訳の生産性において重要な役割を果たします。

機械翻訳 vs. 機械翻訳 + ポストエディット

機械翻訳のみで十分な場合や、翻訳者とのハイブリッド モデルを採用すべき場合など、さまざまなケースについて説明します。 

ニューラル機械翻訳: 翻訳において人工知能 (AI) が果たす役割

ニューラル機械翻訳とは何か、そしてニューラル機械翻訳が言語サービス業界を一変させる可能性について詳しく説明します。

機械翻訳の説明

機械翻訳に関わる重要な用語について、わかりやすくまとめています。 

以下の画像をクリックして、機械翻訳を理解するための主な定義をご覧ください。

お問い合わせ