ライオンブリッジの誇りは社員です。20 年以上にわたって、企業が顧客の心に響くメッセージを発信できるよう支援しています。

ライオンブリッジについて
経営陣
インサイト
ニュース
インサイト
実績

ライオンブリッジの Lainguage Cloud を活用して、御社の包括的なローカリゼーションとコンテンツ制作をサポート

Lainguage Cloud™ Platform
接続性
翻訳コミュニティ
ワークフローのテクノロジー
Smairt Content™
Smairt MT™
Smairt Data™

言語を選択する:

機械翻訳の説明

用語集


約 80 年の長い歴史を経て、機械翻訳 (MT) はようやく活躍の場を得るようになりました。

 

ここ数年、AI が今日の時代精神に強く結び付けられている中で、さまざまな業界で注目されるキーワードの一つとして「ニューラル MT」という用語があります。現時点で機械翻訳 (MT) とのかかわり方がどうであれ、機械翻訳に関する知識を知っておくことでさまざまな場面で役に立つでしょう。

人工知能 (AI) が企業や消費者にとってますます身近になっている中で、それと密接に関連する用語も頻繁に見られるようになりました。この分野に詳しくない方が、互いに同じ意味で使用されることもある用語の違いを区別するにはどうすればよいのでしょうか?

機械翻訳についてどのように理解すべきか?

ライオンブリッジは、世界中を結ぶグローバル ネットワーク コミュニティを介して、世界各地に優秀で実績豊富な MT の専門家を擁しています。この記事は、関連用語の微妙な違いや明確な違いを明らかにすべく、これらの専門家の方々と協力して作成しました。

1. 人工知能 (AI)

MT の最近の傾向を把握するには、圧倒的な存在である人工知能 (AI) が背景にあることを理解する必要があります。AI とは、学習や問題解決など人間のような思考が必要と思われるタスクを行うときに機械が用いる「知能」です。ここ数年、AI は、ますます高まっているコンピューティング能力を原動力として、飛躍的に性能が高まっています。強力なコンピューターによって目下のタスクを集中的に処理できるだけでなく、より先進的なマシン ラーニングが可能になります。マシン ラーニングとは、AI を活用するにあたって必要となる知識をコンピューターが得る方法です。

2. マシン ラーニング

マシン ラーニングはコンピューター サイエンス分野の一つであり、大量のデータを使用して、タスクを行う方法をコンピューターに教えます。マシン ラーニングでは特定のタスクに関連するデータを調査し、データからパターンを見出してそれらを関連付けます。そして学習した内容を利用して、コンピューターがタスクを行う方法を見出します。この分析後、コンピューターによるタスクの実行が上達した場合は、マシン ラーニングが発生したということになります。

私たち人間は世界中のあらゆるものについてデータを持っています。そのため、人々はマシン ラーニングを使用して、天気予報、自動銘柄選択、機械翻訳など、あらゆる場面でコンピューターのパフォーマンスを強化しています。

Female standing holding a laptop

3. 機械翻訳 (MT)

簡単に言えば、機械翻訳とは自動翻訳を意味します。ある言語の文章をコンピューターに入力すると、他の言語で出力されます。機械翻訳は完璧ではありませんが、高品質な翻訳を効率的に生み出すための最も強力なツールの一つです。

過去数十年間、出力物の品質と対応言語の幅広さという点で MT は進化を続けてきました。単純な単語置換システムであった黎明期の MT から、明示的にコーディングされた文法と辞書を持つルールベースの MT、大量の演算を行う枠組みを持つ統計的 MT、ディープ ラーニング (深層学習) とニューラル ネットワークに基づくニューラル MT へと、MT の進化は、コンピューターの性能の進化とその使用性の拡大を反映しています。

4. 統計的機械翻訳

統計的機械翻訳 (SMT) は、マシン ラーニングを活用して原文の翻訳候補を大量に生成し、ターゲット言語で連動して出現する可能性が高い単語やフレーズに基づき、最適なものを 1 つ選択します。SMT は「n グラム」というレンズを通して翻訳を学習します。n グラムとは、ソース言語とターゲット言語で連動して出現する単語の小さなグループです。マシン ラーニングの段階で、SMT システムはトレーニング資料、つまり、ソース言語の原文と、それをターゲット言語に訳した訳文のサンプルを大量に与えられます。学習アルゴリズムでは原文と訳文を n グラムに分割し、特定のソース言語 n グラムが文章に出現したときに、どのターゲット言語 n グラムが訳文で出現する傾向が高いかを判断します。

次に、学習アルゴリズムは、ターゲット言語で一定の単語とフレーズが隣り合って出現する可能性を計算する言語モデルを構築します。学習が終わったら、次は新しい文章の翻訳です。SMT システムは新しい原文を n グラムに分割し、関連性の高いターゲット言語 n グラムを見つけ、翻訳候補の生成を始めます。最終的な訳文は、ソース言語 n グラムと最も関連性の高いターゲット言語 n グラムを持ち、連動して出現する可能性が最も高いターゲット言語の単語を含む文章となります。

SMT は有効に機能しますが、一方で、SMT システムはまったく言語的ではないと捉える見方もあります。実際に SMT システムは n グラムのみを考慮しており、文章全体は考慮していません。これは、次世代の MT とも言うべきニューラル機械翻訳と決定的に異なる点です。

5. ニューラル機械翻訳

ニューラル機械翻訳 (NMT) は、SMT の最大の弱点である n グラム解析への依存を克服しました。NMT は、トレーニング資料を受け取るという点では SMT と同じですが、資料を受け取った後はそのデータの学習方法を自らが決定します。

NMT システムは原文の情報をベクトルに変換し、単語とその周囲の単語の情報を関連付けます。一部のシステムでは 1 つの単語につき数百もの情報ピースがあり、精度を高めています。NMT システムはディープ ラーニングにより、単語や原文に関する大量の情報を捉えて、アテンション モデルと呼ばれる仕組みを使用して、大量のデータ ストリームの解析を通じて、翻訳プロセスにとって重要だと学習した特徴に焦点を合わせます。その結果として生み出される翻訳は、流暢さが劇的に改善されています。これは、コンピューターによる翻訳が今後ますます自然な文章になっていくことを意味します。

NMT はローカリゼーション業界に大きな変革をもたらしました。NMT ツールセットの成熟と改善に伴い、ライオンブリッジでは MT をさらに活用して制作プロセスを高速化しています。

 

ライオンブリッジでは、MT の研究を通じて知識を深めるだけでなく、実績の面でも、2002 年より MT とポストエディット (MT 翻訳後に行われる人間による編集作業) を組み合わせたサービスを積極的に提供しており、その規模は今も年々拡大し、品質も高めています。MT を活用した当社のソリューションについては、こちらをご覧ください

当社の機械翻訳 (MT) については、こちらまでお問い合わせください

linkedin sharing button
  • #blog_posts
  • #translation_localization

#AI #MT #MT、machine translation #ローカリゼーション 
#機械翻訳 #翻訳


Lionbridge
著者
Lionbridge