Silhouette of a man wearing glasses. A geographic pattern is overlaid on half the image, and binary code is in the background of the other half of the image.

챗GPT의 번역 성능 및 기계번역의 미래에 미칠 영향

기계번역 엔진과의 일대일 비교 결과 인상적인 성능을 보여준 챗GPT

마지막 업데이트: 2023/2/17 7:29PM

기계번역(MT)의 미래는 어떤 모습으로 다가올까요? 라이온브리지(Lionbridge)가 항상 고민하는 문제입니다.

2022년 한 해 동안 주요 기계번역 엔진인 Google NMT, Bing NMT, Amazon, DeepL, Yandex는 품질 면에서 이렇다 할 큰 발전을 이루지 못했습니다. 업계에서 최장기간 기계번역 성능을 추적해 온 라이온브리지 기계번역 트래커를 통해 이와 같은 상황을 직접 확인할 수 있습니다. 이러한 부진으로 인해 현재의 신경망 기계번역(NMT) 패러다임에 대해 다음과 같은 의문을 제기하게 되었습니다.

NMT 패러다임은 정체기에 도달한 것일까?
엔진 성능에 이렇다 할 진전이 없는 지금, 새로운 패러다임 전환이 필요한가?
다음 패러다임은 무엇이 될까?

라이온브리지는 미래의 패러다임이 다중 양식 및 다중 언어를 비롯하여 방대한 콘텐츠를 보유한 대규모 언어 모델(LLM)과 관련이 있을 것으로 예상합니다. 그 이유는 챗GPT의 번역 성능과 MT 엔진의 성능을 비교한 획기적인 분석 결과 때문입니다.

OpenAI가 개발한 GPT-3 LLM 제품군의 최신 버전인 챗GPT는 비교 대상으로 지목된 MT 엔진보다는 성능이 떨어졌지만 격차가 크지는 않았습니다. 챗GPT의 성능은 놀라울 정도였으며 챗GPT가 기계번역의 미래에 영향을 미칠 것이란 점에는 의심할 여지가 없습니다.

문의하기

새로운 기계번역 패러다임의 등장이 예견되는 이유

현재의 MT 엔진 동향을 보면 데자뷰가 떠오릅니다.

통계적 기계번역의 시대가 끝나고 그 자리를 NMT가 대체하는 동안 기계번역 품질에는 사실상 거의 변화가 없었습니다. 또한 여러 MT 엔진의 번역 품질도 유사해졌습니다. 이러한 현상이 지금도 일어나고 있습니다.

당장 NMT가 대체되지는 않겠지만, 기하급수적 성장과 수확 가속의 법칙이 옳다고 전제하면 규칙 기반 MT가 30년간 운영되었고 통계적 MT가 10여 년간 주도권을 이어갔으며 NMT가 현재 6년째를 맞이한 것을 고려할 때 새로운 패러다임 전환도 멀지 않은 것으로 보입니다.

차세대 기계번역 패러다임

2022년에 LLM이 중요한 진전을 이루면서 2023년에 이 기술이 MT 영역으로 진입할 수 있는 기반이 마련되었습니다.

LLM은 다양한 작업을 수행하도록 학습된 일반 모델입니다. 그러나 2022년 말에 몇몇 전문 LLM이 일부 특정 분야에서 중요한 발전을 이룬 것으로 확인되었으며, 이러한 발전에 힘입어 LLM은 별도의 학습 과정을 추가하여 번역도 가능하게 되었습니다.

챗GPT를 예로 들자면, OpenAI는 이 최신 모델을 정교하게 조정하여 일반 LLM 작업을 모두 수행하면서 사용자가 묻는 질문에도 답변하도록 했습니다.

즉, 번역과 관련해 LLM을 정교하게 조정하면 이와 유사하게 번역 작업도 수행할 수 있다는 것입니다.

대규모 언어 모델에서 번역을 처리하기 위해 필요한 작업 방식

보다 균형 잡힌 언어 말뭉치를 사용하여 학습을 진행하면 LLM을 사용해 번역할 수 있는 가능성이 더 높아집니다.

GPT-3의 학습에 사용된 말뭉치는 93%가 영어였으며, 다른 모든 언어의 말뭉치는 7%에 불과했습니다. 곧 출시될 것으로 보이는 GPT-4에 비영어권 언어의 말뭉치가 더 많이 포함되면 LLM에서 다양한 언어를 더욱 원활하게 처리할 수 있으므로 번역도 할 수 있게 됩니다. 또한 언어의 균형이 잘 잡힌 이 말뭉치는 번역에 특화된 정교한 모델을 구축하기 위한 토대가 될 수 있습니다.

LLM을 기반으로 새롭게 등장한 이 가상의 MT 패러다임이 지닌 또 다른 흥미로운 측면은 바로 트렌드에 맞게 다양한 형식을 도입할 수 있다는 점입니다. LLM 학습에 언어 데이터 외에 이미지나 동영상과 같은 데이터도 사용할 수 있습니다. 이러한 유형의 학습을 통해 세계에 대한 정보를 추가로 제공하여 번역 품질을 개선할 수 있습니다.

대규모 언어 모델이 신경망 기계번역(NMT) 패러다임의 훌륭한 대안이 될 수 있을까?

LLM이 NMT 패러다임을 대체할 수 있을지 평가하기 위해, 당사가 MT 품질 추적에 사용하고 있는 5가지 주요 MT 엔진과 챗GPT의 번역 성능을 비교했습니다.

예상한 대로 챗GPT는 전문적인 NMT 엔진보다는 번역 성능이 떨어졌습니다. 그럼에도 챗GPT는 기대보다 훌륭한 결과를 보여주었습니다. 그림 1에서 볼 수 있듯이 챗GPT는 전문 엔진에 버금가는 성능을 보였습니다.

챗GPT의 품질을 일반 MT 엔진들과 비교 평가한 방법

여기서는 역편집 거리를 기준으로 영어-스페인어 언어쌍의 복수 참조를 사용해 엔진의 품질 수준을 계산했습니다. 편집 거리는 MT에서 번역한 결과물을 사람에 의한 번역과 같은 수준으로 만들기 위해 사람이 MT 번역을 수정해야 하는 횟수를 측정한 수치입니다. 이 계산에서는 원시 MT 결과를 한 명이 아닌 10명의 번역사가 번역한 내용과 비교(복수 참조)했습니다. 역편집 거리의 수치가 높을수록 품질이 좋다는 것을 의미합니다.

챗GPT와 주요 기계번역 엔진의 자동번역 품질 비교. 복수 참조를 사용한 역편집 거리를 기준으로 평가함.

^{그림 1. 챗GPT와 주요 기계번역 엔진의 자동번역 품질 비교. 영어-스페인어 언어쌍의 복수 참조를 사용한 역편집 거리를 기준으로 평가함.}

챗GPT의 번역 성능 결과에 주목하는 이유

이러한 비교 분석 결과는 MT 엔진이 하나의 자연어 처리(NLP) 작업만 수행하도록 학습된 반면 일반 모델은 여러 다양한 NLP 작업을 수행하도록 학습되었다는 점에서 주목할 만합니다. 심지어 챗GPT는 번역 관련 학습을 받은 적이 없었음에도 번역 성능이 2~3년 전에 출시된 MT 엔진의 품질과 유사했습니다.

라이온브리지 블로그에서 챗GPT와 로컬라이제이션에 대해 자세히 알아보세요.

대규모 언어 모델의 성장에 따른 기계번역의 발전 가능성

대중의 관심과 기술기업의 엄청난 투자를 기반으로 LLM의 성장이 확실시되는 가운데 머지않아 챗GPT가 MT 엔진을 추월할지, 아니면 MT에 새로운 LLM 패러다임이 도래할지 드러날 것으로 보입니다.

MT는 LLM을 기본 토대로 사용할 수 있으나 이 경우 기계번역에 특화되도록 LLM 기술을 조정해야 합니다. 이는 OpenAI와 기타 LLM 기업이 기계가 사람과 대화하듯 소통할 수 있도록 만드는 등 일반 모델을 특정 용도에 특화되도록 개선하는 것과 유사한 작업입니다. 이처럼 전문화 과정을 거치면 작업을 더욱 정확하게 수행할 수 있습니다.

대규모 언어 모델의 미래 전망

대규모 '일반' 언어 모델의 장점은 다양한 작업을 수행할 수 있을 뿐 아니라 대부분의 작업 품질이 뛰어나다는 점입니다. 예를 들어, 또 다른 일반 지능 모델인 DeepMind의 GATO는 600개 이상의 작업을 대상으로 테스트를 거쳤으며, 그중 400개 작업이 '최고 수준(SOTA)'인 것으로 나타났습니다.

앞으로도 GPT, Megatron, GATO와 같은 일반 모델 및 이러한 일반 모델을 기반으로 특정 목적을 위해 만든 전문 모델이라는 두 가지 개발라인이 계속 공존하게 될 것입니다.

일반 모델은 인공일반지능(AGI)의 발전과 장기적으로 훨씬 더 인상적인 개발을 이루는 데 있어 중요합니다. 반면 전문 모델은 단기적으로 특정 영역에서 실용적 목적으로 사용하기 위한 것입니다. LLM의 놀라운 점 중 하나는 두 계열을 동시에 개발하면서 서로 병행하여 작동시킬 수 있다는 점입니다.

기계번역 패러다임 전환에 내재된 의미

현재의 신경망 기계번역 기술 패러다임이 한계에 도달하고 LLM을 기반으로 하는 새로운 지배적인 패러다임이 부상함에 따라 MT 분야에도 얼마간 변화가 있을 것으로 예상됩니다. 대부분의 변화는 기업에 유익할 것으로 보이지만 사람에 의한 번역을 필요로 하는 기업은 또 다른 어려움에 처하게 될 수 있습니다.

예상되는 변화는 다음과 같습니다.

품질 개선

기술의 발전으로 기계번역과 격식에 맞는 표현 및 어조와 관련된 기타 품질 문제 등의 고질적인 문제가 해결됨에 따라 기계번역의 품질이 비약적으로 향상될 것으로 예상됩니다. MT 엔진의 가장 큰 문제인 실제 세계에 대한 정보 부족 문제도 LLM이 해결할 수 있습니다. 해결 방안은 바로 다중 양식 학습입니다.

기술 전문가는 최신 LLM을 학습시킬 때 방대한 양의 텍스트뿐 아니라 이미지와 동영상도 사용합니다. 이러한 학습을 통해 LLM은 기계가 텍스트의 의미를 해석하는 데 유용한 관련성 높은 정보를 더 많이 축적할 수 있습니다.

콘텐츠 생산량 증가 및 일류 번역사의 공급 감소

기업이 더 많은 콘텐츠를 더 빨리 작성할 수 있게 되면서 콘텐츠 작성 속도는 이러한 콘텐츠를 처리할 수 있는 번역사 풀의 확장 속도를 능가할 것으로 예상됩니다. MT 품질이 개선되고 번역사의 생산성이 높아져도 번역 커뮤니티에서 번역 수요를 충족하기에는 역부족인 어려운 상황이 계속될 것으로 보입니다.

기계번역 도입 증가

새로운 기술 패러다임이 등장하고 기계번역의 품질이 향상됨에 따라 번역 서비스에 대한 수요는 계속 증가하여 더 많은 상황에서 더 많은 용도로 사용될 것으로 예상됩니다.

기계번역을 이용한 고객 경험 개선

MT 품질이 향상되고 더욱 개인화된 맞춤형 고객 경험에 대한 요구가 높아짐에 따라, 글로벌 고객의 디지털 경험을 개선하고 관계를 강화하기 위해 MT 사용을 늘리는 기업이 더욱 증가할 전망입니다.

결론

기술기업들이 LLM 기술에 엄청난 관심을 보이고 있습니다. Microsoft는 OpenAI에 100억 달러를 투자했으며, Nvidia, Google 등 다른 기업들도 LLM과 AI 기술에 막대한 비용을 투자하고 있습니다.

앞으로 어떤 미래가 기다리고 있을까요? 라이온브리지는 계속해서 LLM을 평가하며 이 분야의 흥미로운 최신 소식을 꾸준히 전달하겠습니다.

문의하기

기계번역을 최대한 활용할 수 있는 방안이 궁금하지 않으신가요? 라이온브리지가 알려드리겠습니다. 지금 바로 문의하세요.

작성자

Rafa Moral

#translation_localization
#ai
#generative-ai
#blog_posts

서비스 종류

AI

산업 분야

챗GPT의 번역 성능 및 기계번역의 미래에 미칠 영향

새로운 기계번역 패러다임의 등장이 예견되는 이유

차세대 기계번역 패러다임

대규모 언어 모델에서 번역을 처리하기 위해 필요한 작업 방식

대규모 언어 모델이 신경망 기계번역(NMT) 패러다임의 훌륭한 대안이 될 수 있을까?

챗GPT의 품질을 일반 MT 엔진들과 비교 평가한 방법

챗GPT의 번역 성능 결과에 주목하는 이유

대규모 언어 모델의 성장에 따른 기계번역의 발전 가능성

대규모 언어 모델의 미래 전망

기계번역 패러다임 전환에 내재된 의미

품질 개선

콘텐츠 생산량 증가 및 일류 번역사의 공급 감소

기계번역 도입 증가

기계번역을 이용한 고객 경험 개선

결론

문의하기

산업