多言語コンテンツのニーズに対応するために苦心されていませんか。多くの企業がこの問題を抱えています。翻訳チームは長年の間、厳しい予算、限られた人的資源、尽きることのないコンテンツ関連のニーズといったさまざまな課題に対処してきました。しかし、高品質の翻訳を迅速かつ大規模に、しかも大幅にコストを抑えて提供できるとしたらどうでしょうか。人工知能 (AI) を活用すれば、それが可能になります。
当社のウェビナー「AI によるポストエディットの可能性」では、ライオンブリッジと Cisco Systems の専門家チームが、AI を活用したポストエディットによる翻訳とローカリゼーションの変革について語っています。
今回のウェビナーでは、当社の最高技術責任者 (CTO) を務めるマーカス カサールと Cisco Systems の GTS プログラム マネージャーであるヨランダ チャム ユエン氏が、「大規模言語モデル (LLM) を使用した AI ポストエディットで、正確性と信頼性に優れた、費用対効果の高い翻訳を大規模に提供できるか」という興味深いテーマを取り上げています。この問いに対する答えは「イエス」であることが明白であるものの、重要な注意事項が伴います。
AI によるポストエディットは可能であり、優れた成果を期待できます。
— ライオンブリッジ CTO、マーカス カサール
ウェビナー全編をご視聴になるには、下のボタンをクリックしてウェビナー録画版をご覧ください。
AI ポストエディットはもはや遠い理想ではなく、さまざまな案件に実際に導入されており、翻訳プロセスに変革をもたらしています。
Lionbridge Aurora AI™ プラットフォームは、お客様のデータの取り込みから、機械翻訳 (MT) による翻訳、LLM を使用した自動ポストエディット、コンテンツ リポジトリへの登録に至るまで、グローバル コンテンツ ライフサイクル全体のオーケストレーションに対応します。
これを可能にしているのは、API を活用した自動化、サービスとしての統合プラットフォーム (iPaaS)、翻訳メモリ (TM) や用語集、用語管理などの確固とした言語資産の組み合わせです。MT と、最先端のモデルを使用した LLM 活用型ポストエディット、スマートなワークフローを組み合わせることにより、これまでよりも短期間で、計画どおりにコンテンツを提供できるようになります。
しかし、スピードとスケーラビリティだけでは十分ではありません。品質も重要です。そのため、当社のアプローチでは人間参加型 (HITL) の監督を取り入れています。コンテンツの目標を満たす最終成果物が得られるように、人間がモデルのトレーニングと調整を行い、必要に応じて出力を評価します。
ユエン氏には、Cisco の社会的責任に関するグローバルな取り組み「シスコ ネットワーキング アカデミー」での自動ポストエディットの利用についてお話しいただきました。
シスコ ネットワーキング アカデミーでは、ネットワーク、サイバーセキュリティ、プログラミング、その他のデータ サイエンス関連トピックについて無料でテクノロジー教育を提供しており、191 か国 2,300 万人を超える学習者が学んでいます。言語の障壁を取り払い、学習コースの効果を最大限に引き出すにはローカリゼーションが非常に重要になります。
Cisco では、アクセスを拡大してネットワーキング アカデミーのコースを世界中の人々が利用できるようにするため、厳しいスケジュールと予算の中で、数百万語を 10 以上の言語に翻訳するためのスケーラブルなソリューションを必要としていました。
そこでたどりついた答えが、自動ポストエディットの導入でした。
Cisco のソリューションでは、以下が使用されました。
これまでに承認済みのコンテンツが格納された翻訳メモリ。
初期翻訳のスピード向上、コスト削減、一貫性確保のためのニューラル機械翻訳 (NMT)。
出力を修正するための、LLM 活用型 AI ポストエディット。
機能面のインコンテキスト レビューを行う人間のテスター (特に複雑な言語の場合)。
結果はまさに驚くべきものでした。
シスコ ネットワーキング アカデミーでは、自動ポストエディットを利用することにより、わずか 3 か月で 1,500 万語以上を 14 の言語に翻訳し、24 ものコースに対応できました。ボトルネックが翻訳から機能テストおよびステージングに移行し、大幅な効率性の向上が実証されました。この作業全体のコストは 7 万ドル未満に収まり、従来の手法と比較して大幅な節約となっています。
Cisco では、ポストエディットに LLM を利用することで、複数の言語のコンテンツを同時にリリースできるようになり、世界各地からのコースへのアクセスが拡大しています。
「現在では、これまでにないスピードとコストでコンテンツが翻訳されています。… (自動ポストエディットにより) 新たな場、新たな領域への扉が開かれています。他の方法では、このように難易度の高い条件下で、コストに見合う形で実現することは不可能だったでしょう」
— Cisco Systems、ヨランダ チャム ユエン氏
AI ポストエディットは強力ですが、完璧ではありません。本ウェビナー中には、その限界や制限についていくつかの指摘がありました。
リソースが少ない言語では、人材とマシン性能の両面で大きな制限が課される。(最先端のモデルも含め) LLM で優れたパフォーマンスが見られるのは、英語などの話者数の多い言語であり、ニッチな言語では専門的な用語集やトレーニング データが不可欠になります。
AI だけで、文化的なニュアンス、トーン、特定分野の専門知識に対応することは依然として難しい。スポーツ分野の用語や技術系の用語など、分野を問わず、微妙な違いを正確に捉えるには、プロンプト フローの使用と人間による監督が重要となります。
AI によりハルシネーション (不正確な情報や誤解を招く情報) が生成される可能性がある。こうした誤情報は見抜くのが難しい場合があります。AI にはこのリスクがあるため、インパクトの大きなコンテンツに対しては、基本的な安全策として機能テストを実施し、エンドユーザーからの直接的なフィードバックを取り入れることが重要です。
カサールは実際にあったエピソードを紹介しました。eコマース サイトのバスケットボール シューズの商品リストにあった「protect your turf (自陣を守る)」という語句がスペイン語で「césped (人工芝)」と翻訳されていたのです。サッカーならともかく、バスケットボールには適さない言葉です。用語集を改善することでこのエラーが修正され、ユーザーの信頼性向上につながりました。
AI ポストエディットによって、従来型の翻訳ワークフローが置き換えられるかと言えば、完全に置き換えられるわけではありません。ユエン氏とカサールは、特に俊敏さが求められる大規模なプロジェクトでは、AI により新たな可能性が広がる一方で、人間の専門知識が依然として欠かせないことを強調しました。
翻訳者やローカリゼーション担当者は、次のような形で適応する必要があります。
プロンプト エンジニアリングおよびワークフロー自動化のスキルの習得
用語管理とブランド ボイスの習熟
AI の活用による、価値の高いタスク (トーン、オーディエンス エンゲージメント、特定分野の専門的なコンテンツなど) への注力
クリエイティブなインプットの提供と、MT や LLM で生成された出力への品質保証の実施
翻訳・ローカリゼーション業界では、最適な結果を得るために、人間とマシンが協調的に作業を進める「コボティック」(協働ロボティクス) モデルへの移行が進んでいます。
カギとなるのは「統合」です。AI ポストエディットは、コンテンツ管理システム (CMS) やドキュメント管理プラットフォーム、コンテンツが保存・展開されるその他のリポジトリとシームレスに適合される必要があります。統合の自動化により、コンテンツの更新とローカリゼーションのやり取りが迅速かつ効率的に行われます。
用語管理も同様に重要です。カサールの説明によれば、特に翻訳とポストエディットのコストが抑えられている今、確固とした用語集や資産となるブランド ボイスに投資することで、AI によって生成される翻訳の適合性と正確性を劇的に向上できます。
今後、LLM の改善が重ねられ、より厳選されたトレーニング データが利用可能になるにつれて、ローカリゼーションにおける AI ポストエディットの重要性はますます高まっていくでしょう。しかし、テクノロジーが進化し続ける中で、イノベーションを推進し、高い翻訳品質を維持するには、人間の創造性、文脈理解力、継続的な監督が今後も不可欠となるでしょう。
このウェビナーでは、翻訳ワークフローを強化し、大規模なグローバル コンテンツへの対応を可能にする、自動ポストエディットについて説明しています。主なポイントは次のとおりです。
AI によって適切なポストエディットを実施できるため、人間の負担が軽減される。
大規模言語モデルで AI ポストエディットを活用することで、翻訳とローカリゼーションの時間短縮と、スケーラビリティの向上を実現できる。
機械翻訳の継続的な使用と効果的な用語管理 (TM および用語集) により、品質と一貫性を向上できる。
特に専門的なコンテンツやリソースの少ない言語では、人間参加型のアプローチが重要である。
コンテンツのプロファイルに応じて、人間の介入を伴わないポストエディットから、すべてのコンテンツに対するポストエディットの実施まで、さまざまなレベルの AI 活用型サービスを利用できる。
人間の介入を減らしても、許容可能な品質水準を達成できる場合がある。
AI ポストエディットにより、コンテンツのリーチ拡大を実現し、さらなるコスト削減を達成できる新たな可能性が開かれる。
MT ソリューションについては、正確性/精度が長年の課題でした。そのため、当社では、AI ファーストのアプローチを採用するとともに、機械の構成、制御、メンテナンスの実施については、人間参加型のアプローチを依然として採用しています。
AI を活用することで、翻訳メモリ (TM) やニューラル機械翻訳 (NMT) などの従来型ツールの翻訳結果が向上します。
当社の経験の中で、AI ポストエディットはその出力品質を維持しながら、スケーラビリティに関するニーズも満たせることが実証されています。しかし依然として、正確性の確保やコンテンツに関する個別の要件への対応のために、ツールのモニタリングや調整には人間による監督が欠かせません。
当社の AI ポストエディット ソリューションでは、まず、コンテキスト全体を把握するためにソース コンテンツの初期評価を行います。このコンテキストを考慮したうえで編集と検証を行うことにより、コンテンツの目標やプロファイルに即した翻訳結果が得られます。
当社の AI ポストエディット ソリューションは柔軟に調整できる設計となっているため、翻訳プロセスに携わる言語専門家や特定分野の専門家 (SME) からのフィードバックをもとに、言語に関するプロンプトを編集・更新できます。
また、当社ではそれ以外の AI ソリューションも提供しており、ソース分析の実施や、ソース コンテンツの変更に関する推奨事項をまとめたレポートの作成などが可能です。これらのソリューションと AI ポストエディット ソリューションを組み合わせることで、コンテンツ戦略のさらなる強化が可能になります。
当社の AI ポストエディット ソリューションでは、人間が介入することにより言語面で最も高い効果が得られる領域を特定し、そこに的を絞ることができます。
当社では、REACH フレームワークを活用してお客様と連携しながら、コンテンツのニーズを評価し、最適な翻訳結果が得られるよう AI ソリューションを調整します。そのうえで、人間の介入がコンテンツのニーズとプロファイルに見合ったレベルとなるよう、その度合いを定義します。
言語や地域によって異なる業界固有の用語を扱うのは困難ですが、いくつかの方法で対応することができます。
メタデータを活用することで、AI ツールに幅広いコンテキストを提供できます。さらに、コンテンツにラベルやタグが適切に付加されていれば、地域固有のニュアンスなどの追加要件に対応するよう、LLM に指示することができます。当社では、こうした前提条件を満たすためのデータ サービスも提供しています。
自治体や地域に応じた調整が必要な用語については、RAG フレームワークを使用します。AI ポストエディットに関しては、ガイドラインを定め、定義された言語ルールに基づいて LLM で一定のアクションが実行されるようにします。
当社のソリューションでは、補足的なサンプルとして外部資料を参照するよう構成することもでき、これにより特定のコンテキストに合わせてカスタマイズされたコンテンツを LLM でスムーズに生成できるようになります。
この種のコンテンツは時間の流れとともに変化する傾向があるため、言語的なプロンプトのメンテナンスや更新が重要となります。そのため、当社の AI ソリューションは、人間の監督のもとで制御され、キュレーションが行えるように設計されています。
はい。当社の AI ポストエディット ソリューションは特定の LLM に依存せず、特定のモデルに限定されません。調整には OpenAI GPT モデルが使用されていますが、お客様独自の LLM エンジンを活用するための対応も可能です。
その場合はカスタム構成を使用することになり、LLM が品質基準を満たしていることを確認するための付加的な評価や構成が必要になることがあります。
このようなソリューションについては、ニーズ、目標、要件の把握のため、当社のソリューション チームおよび言語テクノロジー チームと連携することをお勧めしています。
当社の AI ポストエディット ソリューションは、言語プロンプトを構成できる点が特長であり、コンテンツのニーズや規制要件の変化に応じて変更することができます。当社は AI ファーストのプロセスを掲げていますが、最適化と調整のための言語プロンプトの管理とキュレーションは、コンピューター リンギスト、各分野の専門家 (SME)、言語専門家など、人間により行われます。
トレーニングされていない、チャットベースの汎用 LLM モデルでは、トーン、内容、文化的ニュアンスに対応するのは困難です。この課題に対応するために、当社のソリューションでは構成を可能にするという手法を採用しており、LLM に対してスタイル、トーン、用語を定義する具体的な指示と、原文のコンテキストに関する言語ガイドラインを指定することができます。言語パラメータとプロンプトの構成を制御することで、AI ポストエディットを活用して翻訳プロセスを強化できます。
当社のソリューションでは、まず、プロンプトにより LLM にソース コンテンツのコンテキストを理解させます。このコンテキストを、用語の評価、部分一致の編集、セグメント レベルの翻訳の検証の指示とともに、LLM の意思決定と編集のガイドラインとして使用することにより、指定したパラメータの範囲内で AI が動作するよう徹底します。当社のアプローチでは言語プロンプトの継続的な更新が可能であるため、ハルシネーションが発生した場合でも、必要に応じて調整や問題の修正を行うことができます。
当社のテスターの多くは、コンピューター リンギスト、またはプロンプト エンジニアリングの経験を持つ言語専門家です。テスターは、AI ポストエディット ソリューションのパラメータの設計、テスト、更新を担当します。このようなテスターが出力を検証してフィードバックを提供し、その結果を踏まえて言語プロンプトおよびパラメータを調整、改善します。
ライオンブリッジがこれまでに取り上げた AI 関連の他のウェビナーにもご興味があれば、「ライオンブリッジのウェビナー」ページにて、それぞれのウェビナー録画版をご確認ください。
翻訳とローカリゼーションのニーズに対応するために、AI ポストエディットの力を活かしたいとお考えであれば、自動化、LLM、人間の専門知識を組み合わせた、俊敏性とスケーラビリティに優れたワークフローの構築をライオンブリッジがお手伝いします。コンテンツの提供方法を一新し、世界中のより多くのオーディエンスに、より大きなインパクトを持って、より迅速かつスマートにリーチを拡大したいとお考えであれば、ぜひ当社にお問い合わせください。
注: 本ウェビナー要約は、Lionbridge Content Remix App で生成したコンテンツを人間のレビュー担当者が適宜校正したものです。
ライオンブリッジでは、お客様のニーズをより深く理解し、課題を解決して海外市場へのリーチ拡大をお手伝いするうえで、当社の革新的な技術がどのように役立つかを詳しくお伝えしたいと考えています。これらの技術の活用についてご興味があれば、ぜひ当社までお問い合わせください。