언어 선택 :

기계 번역에 의한 번역

익숙하지 않은 분야에서 구분 없이 사용되기도 하는 용어들의 차이를 어떻게 분석합니까?  기계 번역은 어떻게 번역합니까?
 

약 80년의 오랜 역사 끝에 기계 번역이 주목을 받고 있습니다.

최근 들어 AI가 시대를 대변하는 가운데 업계 전반에 걸쳐 '신경망 MT'가 큰 관심사 중 하나로 떠올랐습니다. 기계 번역(MT)의 개념과 얼마나 밀접한 관련이 있는지와 별개로 이에 대해 알아야 합니다.

기업과 소비자가 접근할 수 있는 AI 응용 분야가 증가함에 따라 이와 관련된 용어들도 등장했습니다. 익숙하지 않은 분야에서 구분 없이 사용되기도 하는 용어들의 차이를 어떻게 분석합니까?

기계 번역은 어떻게 번역합니까?

저희가 도와 드리겠습니다. Lionbridge는 세계에서 가장 능숙한 MT 전문가를 보유하고 있으며, 업계의 중요 용어들의 미묘하면서도 그렇게 미묘하지만은 않은 차이점을 판단하는 데 도움이 되는 참조서를 개발하기 위해 이들과 협력했습니다.

1. AI.

최근의 MT 트렌드를 이해하려면 이러한 현상의 배경을 먼저 알아야 합니다. 바로 AI(인공 지능)의 강렬한 등장입니다. AI는 본질적으로 인간의 사고 유형이 필요한 것으로 여겨지는 학습 및 문제 해결과 같은 작업을 기계가 수행할 때 보여주는 '인텔리전스'입니다. 최근 들어 컴퓨터 성능이 좋아지면서 AI 역시 그 혜택을 누리고 있습니다. 더 우수해진 성능의 컴퓨터는 당면 과제를 수행하면서 한층 성장한 처리 능력뿐 아니라 AI 응용에 필요한 지식 습득 방법인 기계 학습에서도 더욱 뛰어난 능력을 보여주었습니다.

2. 기계 학습.

기계 학습은 컴퓨터 공학의 한 분야로서 방대한 데이터를 토대로 컴퓨터에게 특정 작업의 수행 방법을 교육합니다. 기계 학습에서는 특정 작업과 관련된 데이터를 검토하고 해당 데이터의 패턴을 탐색하며 패턴 간의 연관성을 파악합니다. 그 후 이렇게 새로 학습된 내용을 활용하여 컴퓨터의 작업 수행 방법을 구성합니다. 이러한 분석 작업 이후 컴퓨터의 작업 능력이 개선된다면 이는 기계 학습에 따른 결과라고 할 수 있습니다.

상상할 수 있는 모든 것에 대한 데이터가 있기 때문에 사람들은 일기예보부터 자동 주식 종목 선정과 기계 번역에 이르기까지 모든 분야에서 컴퓨터의 성능을 개선하기 위해 기계 학습을 사용하고 있습니다.

Female standing holding a laptop

3. 기계 번역.

간단히 말해 기계 번역은 자동 번역입니다. 한 언어로 된 소스 자료를 컴퓨터에 입력하면 다른 언어로 출력됩니다. 완벽하지는 않지만 고품질의 번역을 더욱 효율적으로 생산하는 데 있어 가장 강력한 도구 중 하나입니다.

출력 품질과 지원하는 언어 폭의 측면에서 MT는 지난 수십 년 동안 계속해서 발전하고 있습니다. MT 초기의 단순한 단어 교체 시스템부터 규칙 기반 MT의 명시적으로 코딩된 문법 및 어휘, 통계적 MT의 대량 고속 처리 패러다임, 신경망 MT의 심층 학습 및 신경망 네트워크에 이르기까지 기계 번역의 발전은 더욱 정교해지는 컴퓨터의 활용을 반영했습니다.

4. 통계적 기계 번역.

통계적 기계 번역(SMT)은 기계 학습을 활용하여 해당 원본 문장에 대한 대량의 번역 후보를 생성한 다음 단어와 구가 대상 언어에 함께 등장할 가능성을 기준으로 최적의 번역을 선택합니다. SMT는 원본 및 대상 언어에 함께 등장하는 단어의 소그룹인 'n-gram'이라는 렌즈를 통해 번역을 학습합니다. 기계 번역 단계에서 SMT 시스템은 교육 자료를 활용합니다. 바로 여러 개의 원어 문장 예시와 대상 언어로 번역된 문장들입니다. 학습 알고리즘이 원본 문장과 대상 문장을 n-gram으로 분할하고 문장에 특정 원어 n-gram이 있는 경우 어떤 대상 언어 n-gram이 등장할 가능성이 높은지를 판단합니다.

이후 학습 알고리즘은 해당 단어 및 구가 다른 대상 언어에서 등장할 확률을 계산하는 언어 모델을 구축합니다. 학습이 완료되면 새 자료를 번역할 차례입니다. SMT 시스템은 새 원본 문장에서 n-gram을 파악하고 가장 관련성이 높은 대상 언어 n-gram을 찾은 다음 후보 문장을 생성하기 시작합니다. 최종 번역은 대상 언어 n-gram이 원본 문장의 n-gram과 가장 관련성이 높은 문장이며, 대상 언어 단어가 대상 언어에서 함께 등장할 가능성이 가장 높습니다.

SMT의 성과는 놀랍습니다. 특히 SMT 시스템이 전혀 언어적이지 않다고 생각한다면 더욱 그럴 겁니다. 시스템은 포괄적인 문장이 아닌 n-gram만을 고려하며 이것이 바로 새롭게 떠오르는 MT인 신경망 기계 번역과 다른 점입니다.

5. 신경망 기계 번역.

신경망 기계 번역(NMT)은 SMT의 가장 큰 단점을 보완합니다. 바로 n-gram 분석에 대한 의존입니다. NMT는 기계를 활용합니다. SMT와 마찬가지로 시스템에서 교육 자료를 받지만 큰 차이점이 있습니다. 바로 시스템에서 자료를 받으면 자체적으로 데이터에 관한 모든 것을 학습하는 방법을 결정한다는 것입니다.

NMT 시스템은 각 원본 문장에 대한 정보 벡터를 구축하여 각 단어와 그 주변 단어 관련 정보를 연결합니다. 일부 시스템에는 단어당 수백 개의 정보가 제공되어 높은 정확도를 만들어냅니다. 심층 학습을 통해 NMT는 각 단어 및 원본 문장에 관한 대량의 정보를 포착하고, 주의 모델을 활용하여 대량의 데이터 스트림 분석을 통해 학습한 중요 특징이 번역 프로세스에서 중요하다는 점을 강조합니다. 그 결과 번역의 문맥이 개선되었고, 그에 따라 컴퓨터에서 생성한 번역이 점점 자연스러워지기 시작했습니다.

MT 패러다임으로서 NMT는 아직 생소하지만 업계의 판도를 바꿀 만한 요소입니다. 사용 가능한 도구 세트가 개선될수록 Lionbridge는 계속해서 MT의 활용을 높여 생산성을 가속화할 것입니다.

Lionbridge는 MT 언어를 능숙하게 구사하고 있습니다. 2002년부터 대규모 MT 및 사후 편집 서비스를 제공하고 있으며, 이는 매년 발전하고 있습니다. 능숙한 MT 활용으로 고객을 어떻게 돕고 있는지 여기에서 자세히 알아보세요.

기계 번역 요건에 대해 Lionbridge 팀과 논의하시기 바랍니다.

  • #blog_posts
  • #translation_localization

Lionbridge
AUTHOR
Lionbridge