본문 바로가기

my life

구글·네이버 위협하는 딥엘(DeepL) 번역기, 한국어 버전 품질은?

728x90

 

2016년 인공신경망 번역이 적용되기 이전의 번역기는 구문 기반 기계번역(PBMT)을 사용했다. 글의 형태와 단어만으로 내용을 번역하니 품질이 떨어지고, 앞뒤가 맞지 않았다. 반면 인공신경망 번역은 웹에서 수집된 데이터로 단어와 문장의 문맥을 분석한 다음 번역하기 때문에 품질이 훨씬 뛰어나다. 다만 한국어는 우리나라에서만 사용해 데이터가 부족하고, 또 로마자 기반 언어와 체계가 달라서 번역 품질이 좋지 않다. 그래서 지금까지는 데이터베이스 확보가 용이한 구글과 네이버가 국내 기계번역 시장을 양분하는 상황이었다.

딥엘(DeepL), 독자적인 인공신경망으로 한국어 번역 접근

이미 구글과 네이버가 시장을 독식하고 있는 상황이지만, 지난 1월 독일의 인공지능 커뮤니케이션 기업 딥엘(DeepL)이 양강 구도의 시장에 도전장을 내밀었다. 딥엘은 2017년 야로스와프 쿠틸로브스키(Jaroslaw Kutylowski)가 설립한 기업으로, 인공신경망 번역을 기반으로 하면서도 네트워크 아키텍처와 학습 데이터, 학습 방법 등에 차별화를 두어 언어의 미묘한 문맥 차이나 뉘앙스까지 파악한 번역 결과를 내놓는다.

 

딥엘의 핵심은 공통된 어원을 갖는 쌍형어 사전 '링게(Linguee)' 기반의 인공신경망 데이터베이스다. 여러 언어로 작성됐지만 동일한 내용을 담은 문서를 데이터로 삼는다. 여러 언어로 쓰이는 EU 의회 문서나 법률, 영어와 프랑스어가 공용인 캐나다 정부 등의 문서가 대표적이다. 또한 번역 결과를 반복 대조해 오차를 수정하고, 번역에 필요한 데이터인 매개변수를 작은 단위로 쪼개어 학습한다. 덕분에 대형 컴퓨팅 클러스터가 필요한 타사의 인공신경망과 다르게 작은 시스템에서도 번역 품질을 유지한다.

 

딥엘 번역기는 홈페이지를 방문해 누구나 무료로 사용할 수 있다. 흥미로운 점은 타사 번역기와는 다르게 더 빠른 번역을 위한 유료 버전이 있으며, 다른 시스템으로 탑재할 수 있도록 API(애플리케이션 프로그램 인터페이스) 형태로도 배포한다. API를 활용하면 기업 내 커뮤니케이션에 실시간 번역을 적용하거나, 운영체제 및 애플리케이션의 현지화, 증강현실 번역 등 다양한 형태로 쓸 수 있다.

번역 기능 측면에서는 문장 번역뿐만 아니라 서식이 있는 문서 형태의 파일을 번역하거나, 웹 페이지 전체를 번역하는 기능도 제공된다. 구글 크롬의 확장 프로그램으로 설치해 웹 채팅을 실시간 번역하거나 이메일을 번역하는 등의 방식으로도 쓸 수 있다. 그렇다면 딥엘의 번역 품질은 어느 정도일까?

딥엘 번역의 품질을 시험해보기 위해 구글 번역기와 딥엘 번역기에 동일한 문장을 번역하고 그 결과를 분석했다. 사용한 문서는 영문으로 작성된 버전과 한국어로 작성된 버전이 각각 존재하는 버전을 활용했다. 가장 먼저 활용한 번역은 애플코리아가 지난 7일 배포한 ‘나랑 노랑! Apple, 새로운 iPhone 14 및 iPhone 14 Plus 발표’에 포함된 내용 중 일부다.

애플코리아 한글 보도자료 - 프로급 12MP 메인 카메라, 울트라 와이드 카메라, 새로운 전면 TrueDepth 카메라와 함께라면, 첨단 카메라 시스템을 언제나 휴대하고 다니는 셈이다.

애플 영문 보도자료 - With a pro-level 12MP Main camera, the Ultra Wide camera, and a new front TrueDepth camera, users have an advanced camera system right in their pockets.

구글 번역 - 전문가 수준의 12MP 메인 카메라, 울트라 와이드 카메라 및 새로운 전면 TrueDepth 카메라를 통해 사용자는 주머니에 바로 고급 카메라 시스템을 사용할 수 있습니다.

딥엘 번역 - 전문가 수준의 1,200만 화소 메인 카메라, 울트라 와이드 카메라, 새로운 전면 트루뎁스 카메라가 탑재되어 있어 사용자는 고급 카메라 시스템을 주머니에 넣고 다닐 수 있습니다.

 

 

 

우선 한글 보도자료의 경우 번역가의 의역이 포함돼 있고, 조금 더 문장이 매끄럽게 사용됐다. 반면 딥엘과 구글 번역은 영문을 가감 없이 번역한다. 이때 딥엘 번역의 내용을 보면 12MP를 1,200만 화소로, 그리고 TrueDepth를 트루뎁스로 번역한 점이 인상적이다. 12MP는 12 Megapixel의 약자로, 관련 지식이 있어야 1,200만 화소라고 쓸 수 있다. 즉 단위를 한국에서 쉽게 이해할 수 있는 단위로 환산해서 번역한 것이다. 트루뎁스 역시 고유명사라서 번역기가 이를 인지해야 번역이 가능한 부분이다.

번역기의 기본은 직역임에도 이해를 돕기 위해 이런 부분까지 의역했다는 부분은 실로 놀랍다. 아울러 고급 카메라 시스템을 주머니에 넣고 다닌다는 부분도 구글 번역보다 딥엘 번역의 문장이 조금 더 원문에 가깝다. 심지어 애플코리아의 보도자료는 다소 꾸밈이 들어갔기 때문에 문장 자체는 딥엘 번역이 더 이해하기 쉽다.