'생각보다 괜찮은데' 카카오도 AI 기계 번역..구글·네이버와 3파전

김남희 기자 2017. 10. 8. 11:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

카카오 가세한 인공지능 기계 번역구글·네이버·카카오, 인공신경망 기계 번역(NMT) 기술로 번역구글, 번역 가능 언어 가장 많고 번역 품질 상대적으로 우수

카카오가 구상한 인공지능 생태계 구조도. 카카오의 통합 인공지능 플랫폼 ‘카카오 I’는 음성 엔진, 시각 엔진, 대화 엔진, 추천 엔진, 번역 엔진으로 이뤄졌다. /카카오

카카오(035720)가 지난달 20일 인공지능(AI) 기반 번역 서비스를 시작했다. 구글과 네이버가 앞서 있는 국내 AI 번역 서비스 경쟁에 카카오가 가세한 것이다. 카카오의 AI 번역은 아직 시범 서비스 단계다. 카카오 번역은 구글 번역이나 네이버 번역과 어떻게 다를까.

◆ 카카오 AI 번역 시범 서비스 시작…구글·네이버와 경쟁

카카오의 번역 서비스는 카카오가 개발한 통합 인공지능 플랫폼 ‘카카오 I(Kakao I)’의 여러 기술 중 번역 엔진을 적용해 만들었다. AI 연구개발 부서인 AI 부문에서 개발이 이뤄졌다. 베타 버전(시험판)으로 공개됐기 때문에 지금은 ‘다음’ 모바일 앱(응용프로그램)과 카카오톡 안의 ‘채널’에서만 사용할 수 있다. 다음 앱과 카카오톡 채널에서 ‘번역기’라고 검색하면 된다. 카카오는 이달 안에 다음 PC 버전에서도 인공지능 번역 서비스를 이용할 수 있게 할 예정이다.

현재 영어와 한국어(영-한, 한-영) 번역만 가능하다. 분량도 500자로 제한됐다. 카카오는 앞으로 일본어와 중국어로 번역 언어를 확대할 예정이다.

카카오의 인공지능 번역은 구글과 네이버의 번역 서비스와 마찬가지로 인공신경망 기계 번역(neural machine translation·NMT) 기술을 적용했다. NMT는 한 문장을 단어나 구(句) 단위로 쪼개서 번역하는 것이 아니라, 앞뒤로 이어진 여러 문장 사이의 문맥을 파악한 후 이 문장들을 한꺼번에 통째로 다른 언어로 바꾸는 방식이다. 어순과 문법이 더 자연스럽고 문장 간 맥락 이해와 의미 전달이 더 매끄럽다. 이용자가 늘고 데이터가 많아질수록 기계 학습에 따라 번역 품질이 더 좋아질 수 있다.

임지훈 카카오 대표는 “번역은 (AI의) 코어(핵심) 기술”이라며 “개선의 여지는 있지만 앞으로 더 확대될 것”이라고 말했다.

네이버는 AI 번역 서비스 ‘파파고(Papago)’로 번역할 수 있는 언어를 늘리며 이용자를 끌어들이고 있다. 올해 7월 6개(한국어·영어·중국어 간체·일본어·프랑스어·스페인어) 언어로 정식 서비스를 시작한 이후, 지난달 중국어 번체·베트남어·태국어·인도네시아어를 추가해 NMT 적용 언어를 총 10개로 늘렸다.

왼쪽은 빌 게이츠가 자신의 블로그에 유발 하라리 히브리대 교수의 저서 ‘호모 데우스’를 추천하며 쓴 영문. 오른쪽은 ‘구글 번역’을 이용해 한국어로 번역한 결과.

네이버는 올 5월 출시한 콘텐츠 큐레이션 서비스 ‘디스코’에도 연내 NMT 기술을 적용할 예정이다. 이렇게 되면 디스코에 올라오는 외국어 기사나 블로그 포스트 등을 번역을 거쳐 한국어로 볼 수 있다.

구글은 가장 많은 언어에 AI 번역 기술을 적용하고 있다. 선다 피차이 구글 최고경영자는 이달 4일 미국 샌프란시스코에서 열린 ‘픽셀 2’ 스마트폰 공개 행사에서 “현재 구글 NMT 기술이 96개 언어에 적용되고 있으며, 하루 20억건의 번역이 처리되고 있다”고 말했다.

구글은 지난해 11월부터 번역 서비스 ‘구글 번역(Google Translate)’에 NMT 기술을 적용했다. 전산언어학자인 최현정 구글 연구원은 “한국어 통·번역 때 구글의 강점은 맥락을 자연스럽게 이해하는 것”이라고 말했다.

구글은 ‘픽셀 2’ 스마트폰을 선보이며 40개 언어를 실시간 통역해주는 무선 헤드폰 ‘구글 픽셀 버즈(Google Pixel Buds)’도 함께 공개했다. 예를 들어 픽셀 2 스마트폰과 귀에 꽂은 픽셀 버즈 헤드폰을 연동한 후 헤드폰 착용자가 한국어를 말하면 픽셀 2 스마트폰에서 영어 통역이 나온다. 상대방이 영어로 대답하면 헤드폰 착용자의 귀에는 한국어로 통역된 음성이 들린다.

◆ 빌 게이츠 영문을 한국어로…구글 번역이 상대적으로 뛰어나

구글·네이버·카카오의 인공신경망 기계 번역(NMT) 수준을 살펴보기 위해 빌 게이츠가 쓴 영문을 한국어로 번역해봤다. 빌 게이츠가 올해 5월 22일 자신의 블로그(gatesnotes)에 올린 여름 추천 도서(5 Good Summer Reads) 중 유발 하라리 히브리대 교수의 저서 ‘호모 데우스(Homo Deus)’를 추천한 대목을 뽑았다. 세 회사 모두 NMT 기술을 쓰지만, 번역 결과는 조금씩 달랐다.

전체적인 맥락 이해는 구글 번역이 가장 뛰어났다. 구글 번역은 빌 게이츠가 ‘I recommended Harari’s previous book Sapiens in last summer’s reading list, and this provocative follow-up is just as challenging, readable, and thought-provoking’이라고 쓴 영어 문장을 ‘지난 여름 독서 목록에서 Harari의 이전 저서 Sapiens를 추천했습니다. 이 도발적인 후속 조치(후속작이란 의미)는 도전적이고, 읽기 쉽고, 생각을 자극하는 것입니다’로, 영어 원문의 의미에 가장 가깝게 번역했다.

왼쪽은 빌 게이츠가 쓴 영문을 ‘네이버 파파고’를 이용해 한국어로 번역한 결과. 오른쪽은 카카오의 한국어 번역 결과. 카카오는 글자 수 제한 때문에 글 일부가 잘렸다.

네이버 파파고(저는 하라리의 이전 책들을 지난 여름의 독서 목록에 추천했는데, 이 자극적인 후속 조치는 도전적이고, 읽기 쉽고, 사려 깊은 것 같습니다) 번역에선 하라리의 이전 책 제목이 ‘사피엔스’란 부분이 빠졌다. 카카오(나는 지난여름에 출간된 하라리의 책 《사피엔스》를 추천했다) 번역에선 ‘사피엔스’가 지난 여름에 출간된 책이라고 잘못 번역됐고 후속작에 대한 평가 부분은 핵심 정보인데도 아예 번역에서 빠졌다.

빌 게이츠는 ‘호모데우스는 사회를 구성해온 원칙들이 21세기에 큰 변화를 겪을 것이며, 지금 우리가 알고 있는 삶에 큰 영향을 미칠 것(Homo Deus argues that the principles that have organized society will undergo a huge shift in the 21st century, with major consequences for life as we know it)’이라고 썼는데, 이 문장은 구글(호모 데우스 (Homo Deus)는 사회를 조직한 원칙들이 21 세기에 커다란 변화를 겪을 것이며, 우리가 알고있는 것처럼 인생에 큰 영향을 미칠 것이라고 주장한다)과 카카오(호모 데우스는 사회를 조직한 원칙은 21 세기에 큰 변화를 겪을 것이며, 우리가 알고 있는 삶의 주요 결과를 초래할 것이라고 주장합니다) 번역 결과가 상대적으로 나았다.

네이버 파파고(호모 데우스는 우리가 알고 있는 사회주의 원칙이 21세기에 커다란 변화를 가져올 것이라고 주장한다)는 ‘사회를 구성해온 원칙’을 ‘사회주의 원칙’이라고 오역하면서 문장 전체의 의미가 원문의 의미와 달라졌다.

세 번째 문장(So far, the things that have shaped society—what we measure ourselves by—have been either religious rules about how to live a good life, or more earthly goals like getting rid of sickness, hunger, and war)도 카카오(지금까지 사회를 형성한 것들, 즉 우리가 스스로 측정하는 것들은 좋은 삶을 사는 방법에 대한 종교적 규칙이거나, 제거하는 것과 같은 더 세속적인 목표였습니다)와 구글(지금까지 사회를 형성 한 것, 즉 우리가 스스로를 측정 한 것은 좋은 삶을 사는 법에 관한 종교적인 규칙이었습니다. 병이나 기아와 전쟁을 없애는 것과 같은 세상적인 목표였습니다) 번역 결과가 상대적으로 원문의 의미에 가까웠다. 카카오 번역은 글자 수 제한(최대 500자) 때문에 원문 일부가 잘렸지만, 남아있는 부분의 의미는 잘 살렸다.

네이버(지금까지 우리 스스로를 측정하는 것은 우리 스스로를 건강하게 하는 방법에 대한 종교적인 규칙이었습니다. 어떻게 하면 좋은 삶을 살아갈 수 있을까, 배고픔, 배고픔, 전쟁을 없애는 것입니다) 번역 결과는 다소 부정확했다.

구글, 네이버, 카카오 번역 모두 한국어 변환 때 높임법 표현이 일관되지 않게 섞여 있는 점은 비슷했다. 예를 들어, 카카오 번역에서 앞문장은 ‘추천했다’로 끝났지만, 뒷문장은 ‘주장합니다’로 끝난 식이다.

- Copyrights ⓒ 조선비즈 & ChosunBiz.com, 무단 전재 및 재배포 금지 -

Copyright © 조선비즈. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?