言語:
言語:
ライオンブリッジは、テキスト、音声、オーディオ、ビデオから、構造化と非構造化データまで、世界で最も多くのコンテンツを作成、変換、テスト、トレーニングしています。
ソリューションズ
ライオンブリッジの専門家は、お客様の業界とその課題を隅々まで理解しています。
ライオンブリッジの Lainguage Cloud を活用して、御社の包括的なローカリゼーションとコンテンツ制作をサポート
ライオンブリッジは、テキスト、音声、オーディオ、ビデオから、構造化と非構造化データまで、世界で最も多くのコンテンツを作成、変換、テスト、トレーニングしています。
ライオンブリッジが提供する技術コンテンツ / 専門コンテンツの制作サービス
技術文書の作成
トレーニングおよび e ラーニング
財務報告
多文化マーケティング
翻訳サービス
翻訳とローカリゼーション
ビデオ ローカリゼーション
ソフトウェア ローカリゼーション
規制対象文書の翻訳とローカリゼーション
通訳
多言語 SEO およびデジタル マーケティング
コンテンツ最適化サービス
Web サイト ローカリゼーション
あらゆる言語と市場を対象とするテスティング サービス
コア テスティング
互換性テスト
互換性テスト
相互運用性テスト
アクセス可能性テスト
UX/CX テスト
ソリューションズ
デジタル マーケティング
ライブ イベント
機械翻訳
ライオンブリッジのナレッジ ハブ
ローカリゼーションの未来
最先端免疫学事情
COVID-19 リソース センター
ディスラプション シリーズ
患者エンゲージメント
ライオンブリッジのインサイト
ライオンブリッジの Lainguage Cloud を活用して、御社の包括的なローカリゼーションとコンテンツ制作をサポート
Lainguage Cloud™ Platform
接続性
翻訳コミュニティ
ワークフローのテクノロジー
Smairt Content™
Smairt MT™
Smairt Data™
言語を選択する:
機械翻訳 (MT) テクノロジーには長い歴史がありますが、とりわけ近年の急速な進歩には目覚ましいものがあります。かつてない量のコンテンツがさまざまな言語で生み出されている現在、グローバリゼーションが進む中で世界にリーチを確実に広げる手段として、機械翻訳の活用に企業からの注目が集まっています。
機械翻訳の導入をお考えの際は、以下の 4 つの基本的なアプローチからいずれかをお選びいただけます。
どのアプローチを採用するにせよ、御社に適したエンジン選びは容易ではなく、適切なデータと経験を踏まえて判断する必要があります。その点、ライオンブリッジは機械翻訳の分野で 20 年以上の経験を誇り、機械翻訳テクノロジーに関する膨大な言語データと品質データを蓄積しているエキスパートです。御社が適切な判断を下せるよう、あらゆる面でお手伝いいたします。この Web ページでは、よく利用される言語ペアについて、機械翻訳エンジンの性能に関する基本的な情報を提供しています。皆さまのコンテンツに合った最良の選択をしていただくためにご活用ください。
数多くの機械翻訳エンジンの中から選択するときには、特定のエンジンは特定の機能や分野に長けているという点に留意することが重要です。 御社のニーズと機械翻訳エンジンの特徴や用途が一致しないと、どれだけ優れたエンジンであったとしても、その能力を十分には発揮できません。 最適なオプションを見極めるには、まずはなぜ機械翻訳を利用するのかを明確にします。
全般的な用途で機械翻訳エンジンを使用したいのであれば、Google Translate や Bing Translator を使用するのが適切でしょう。 特定の言語や分野に対応した機械翻訳サービスを必要としているのであれば、Amazon Translate または DeepL Translator を使用することで、よりよい結果が得られるでしょう。
ライオンブリッジの機械翻訳トラッカーなら、月ごとのパフォーマンス分析を通じて、御社で利用する言語ペアに最適な機械翻訳エンジンを特定することが可能です。 次に「最も優れた機械翻訳エンジンはどれか」という質問をするときは、「私にとって最適な機械翻訳エンジンはどれか」と言い換えて質問してみてください。そしてその答えを導き出せるのは当社ライオンブリッジです。ぜひ当社までお問い合わせください。
汎用型の機械翻訳 (MT) エンジンは、翻訳プロセスを自動化したい企業にとって十分な結果を提供することが多くあります。 ですが、質の低い訳を提案することもあります。コンテンツが技術的なものであったり、高度に専門的なものであったりする場合は特にです。
具体的な目的を達成するために機械翻訳 (MT) の品質を改善したいと考えている企業は、 MT のカスタマイズかトレーニング、あるいはその両方を実施する選択肢があります。 どちらの方法も、あるいは両方を組み合わせた場合も、自動化された翻訳プロセスにおいてより優れた結果を得られるようになります。
ただし、それぞれのアプローチは互いに異なるものであり、どちらを採用しても変わりがない、というものではありません。 表 1 は、MT のカスタマイズおよび MT のトレーニングに関する概要とそれぞれの方法を評価する際に検討すべき事項を示しています。
MT のカスタマイズ | MT のトレーニング | |
---|---|---|
定義としくみ | 機械翻訳が生成する翻訳の精度を高めるために、既にある機械翻訳エンジンを、用語集や翻訳しない語句 (DNT) リストと併せて採用すること | 機械翻訳が生成する翻訳の精度を高めるために、コーパスの豊富なバイリンガル言語データを活用して MT エンジンを構築およびトレーニングすること |
達成される内容 | MT が提案する翻訳をより正確にし、ポストエディットの必要性を低減する | MT が提案する翻訳をより正確にし、ポストエディットの必要性を低減する |
具体的な利点 | 適切なブランド名や用語を使用して地域別のバリエーションを用意できるようになる | 企業独自のブランド ボイス、トーン、スタイルを維持しながら、地域別のバリエーションを用意できるようになる |
使用上のリスク | 適切に実行されないと MT が提案する翻訳の質が低く、全体的な品質を損なう可能性がある | エンジンをトレーニングするために必要な質の高いデータが十分にない場合、MT のトレーニングの成果を得ることができない可能性がある。経験のない作成者がコンテンツで用語を多用しすぎると、MT によって品質レベルの低い翻訳が提示され、全体の品質を損ねる可能性がある。 |
使用するタイミング | 技術的なコンテンツや細部を重視するコンテンツ、および次のことが当てはまるコンテンツに理想的な選択肢 *用語を正確に翻訳する必要がある * 地域別のバリエーションを用意する必要があるものの、MT のトレーニングを実施するには十分なデータがない |
専門性の高いコンテンツ、マーケティングやクリエイティブなコンテンツ、および次のことが当てはまるコンテンツに理想的な選択肢 *独自のブランド ボイスやトーン、スタイルを維持する必要がある *地域別のバリエーションを用意する必要があり、MT のトレーニングを実施するための十分なデータがある |
成功要因 | インプットとアウトプットの標準化ルール、用語集、および DNT を適切に管理できる、経験ある MT エキスパート | エンジンを十分にトレーニングするために必要な少なくとも 15,000 のユニークなセグメント |
コスト上の検討事項 | MT エンジンに設定するプロファイルをアップデートするための 1 回限りの費用と、用語集を維持・管理するための費用が継続的にかかる。潜在的な利点を考慮すると比較的安価。また、一般的には MT のトレーニングにかかる費用よりも安価で済む | 初回のトレーニングにかかる費用に加え、MT のパフォーマンスをモニタリングする中で改善の余地があると見受けられる場合に追加のトレーニング費用がかかる可能性がある。潜在的な利点を考慮した場合に、特定のケースで投資の価値がある |
表 1. MT のカスタマイズと MT のトレーニングの比較
機械翻訳のカスタマイズと機械翻訳のトレーニングの比較について詳しくは、当社のブログ記事をお読みください。
—トーマス マッカーシー、ライオンブリッジ MT ビジネス アナリスト
機械翻訳 (MT) において、大規模言語モデル (LLM) がニューラル機械翻訳 (NMT) に取って代わるパラダイム シフトが起こるのでしょうか。 これを確かめるために、OpenAI の LLM である GPT-3 ファミリーの最新バージョン ChatGPT と、MT 品質トラッキングで当社が利用している 5 つの主要 MT エンジンとで、翻訳パフォーマンスを比較しました。
予想どおり、特化型 NMT エンジンのほうが ChatGPT よりも翻訳は優れていました。 しかし、驚くべきことに、ChatGPT のパフォーマンスも立派なものでした。 図 1 に示すように、ChatGPT は特化型エンジンに匹敵する結果を残しました。
品質レベルは、英語からスペイン語に翻訳する言語ペアの複数の参照訳を使用して、逆編集距離に基づいて算出しました。 編集距離は、MT の出力に対して、翻訳者による翻訳品質と同等にするために人間が行わなければならない編集の量を算出するものです。 今回は、翻訳者による翻訳 1 種類のみではなく、10 種類、つまり複数の参照訳と MT のみの出力を比較しました。 逆編集距離は、結果の数値が大きいほど品質が優れていることを意味します。
これらの結果は目を見張るものです。というのも、汎用モデルは自然言語処理 (NLP) タスクを実行するようトレーニングされており、特に翻訳実行のためのトレーニングはされていないからです。 ChatGPT のパフォーマンスは、2 ~ 3 年前の MT エンジンの品質レベルと同等です。
世間の関心とこの技術への IT 企業の大型投資を踏まえて LLM の進化を考えると、ChatGPT が MT エンジンを追い越すかどうか、または MT が新しい LLM のパラダイムを採用するようになるかどうかがわかるまでにそれほど時間はかからないかもしれません。 MT が LLM をベースとして使用する可能性はありますが、その時は機械翻訳向けにテクノロジーのチューニングが行われる可能性があります。 これは、機械と人間の会話によるコミュニケーションを可能にするといった特定のユース ケース向けに汎用モデルを向上させるべく、OpenAI や他の LLM 企業が行っていることと同様のことです。 特化することで、実行するタスクの精度が高まります。
これらの大規模言語「汎用」モデルの良い点の一つは、さまざまなことを実行でき、それらのタスクのほとんどで優れた品質を示せることです。 たとえば、DeepMind の GATO は別の汎用 AI モデルですが、600 以上のタスクでテストされ、うち 400 で「現時点での最先端レベル (SOTA: State-of-the-Art)」という結果を示しました。
GPT、Megatron、GATO のような汎用モデルと、これらの汎用モデルをベースに特定の目的のために特化したモデルという 2 つの開発ラインは今後も存続するでしょう。 汎用モデルは、汎用人工知能 (AGI) を進化させる上で、そしておそらくは長期的な、より目覚ましい発展を進める上で重要です。 そして特化型モデルは、特定の分野で短期的に実用化されるでしょう。 LLM で注目すべきことの一つは、両方のラインが並行して進化し、機能できることです。
今後どうなるか、興味がそそられます。 引き続き LLM を評価し、結果を公開することで、皆さまにこの心躍る進化の最新情報をお届けします。ChatGPT の翻訳パフォーマンスについて掘り下げた記事、またChatGPT とローカリゼーション、ChatGPT が変革をもたらすと考えられる理由を詳しく説明した記事を公開していますので、ぜひ当社のブログ記事をご覧ください。
—ラファ モラル、ライオンブリッジ、イノベーション担当バイス プレジデント
免責事項