본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

플리토, “번역 서비스에서 번역 플랫폼으로”

OSS 게시글 작성 시각 2016-08-16 18:38:29 게시글 조회수 3718

2016년 8월 15일 (월)


ⓒ 블로터닷넷, 이지영 기자 izziene@bloter.net



‘언더커버보스’처럼 자기네 서비스 성격을 몸소 체험하고 시험하기 위해 직원들 몰래 서비스 계정을 만들어 이용하고 있는 대표가 있다. 서비스 이용을 위해 손수 포인트까지 모을 정도다. 그의 정체를 아는 직원은 몇 안 된다. 서비스 안에서 그는 해당 서비스를 책임지는 대표가 아니라 그저 남들과 비교해 열심히 번역하는 번역가에 불과하다.


“열심히 번역해서 포인트를 모아 다시 번역 서비스를 이용하는 데 활용합니다. 저 나름 서비스 상에서 번역가로 유명합니다. 아마 번역 건수로 순위를 매기면 상위권에 속할걸요. 별도 이미 4개 정도 달았습니다.”


이정수 플리토 대표 이야기다. 플리토는 2012년 언어장벽 없는 세상을 실현하자는 목표로 설립된 회사다. 집단지성, 언어데이터, 전문번역가 등을 활용한 통합 번역 서비스를 제공한다. 현재 플리토 번역 서비스는 173개국에서 550만 사용자가 이용하고 있다. 한국어, 중국어, 영어, 일본어, 불어 등 18개 언어를 지원하며, 매일 3만건 이상 번역 요청이 플리토 안에서 이뤄진다. 웹과 iOS, 안드로이드 기기에서 이용할 수 있다.


이정수 플리토 대표

이정수 플리토 대표


어색한 번역 서비스, 사람으로 문제 해결


“모든 기술 발전 과정에 있어 최고의 과정은 기술을 통해 사람과 사람 사이 관계를 개선하는 데 있다고 생각합니다. 교통수단 발전이 사람과 사람이 만날 수 있게 거리감을 해결해줬고, 통신이 발전해서 사람과 사람이 언제든 대화를 나눌 수 있게 관계가 개선됐다면, 언어 측면에서 발전이 이뤄져 누구나 서로 편하게 의사소통을 할 수 있으면 좋겠다고 생각했지요.”


번역 서비스 시장은 블루오션이 아니다. 구글, 마이크로소프트(MS) 등 다양한 글로벌 기업과 연구소와 기관이 나서고 있는 레드오션에 가깝다. 그런데도 이정수 대표가 이 시장에 뛰어든 이유는 딱 하나, 자신감이다.


그는 대부분의 번역 서비스가 기계적으로 번역하고 있는데, 이를 통해 언어장벽을 해소하기엔 한계가 있다고 판단했다. 단순한 자동 번역 서비스는 컴퓨터 알고리즘으로 해결할 수도 있다. 그러나 언어의 밑바탕엔 한 나라의 문화와 복잡한 감성이 녹아들어 있다. ‘재수 없다’란 단어 하나만 봐도 언제 어떤 상황에 따라 쓰이냐에 따라 해석이 달라진다. 이를 컴퓨터 알고리즘으로 상대방 의도를 파악한 번역을 제공하긴 지금 현재 컴퓨터 기술로 어렵다.


“사람의 뇌는 비문법적인 대화를 문법적으로 받아들여서 이해합니다. 기계는 다르지요. 기계가 이를 해결하긴 어렵다고 생각합니다. 그런데 점점 언어를 잘하는 사람이 늘어나고 있습니다. 한 사람이 20개 국어를 하는 건 아니지만, 모국어 외에 다른 언어도 이해하는 사람이 늘어나고 있지요. 사람이 하는 번역이 더 정확하지 않을까 하는 생각이 들더군요.”


이정수 대표는 어느날 이런 일을 경험했다고 한다. 플리토 회사 근처에 쌀국수를 만드는 태국 음식점이 있다. 그 태국 음식점엔 다음과 같은 문구가 쓰여있다. ‘우린 매일 아침 가게에서 만드는 생면으로 쌀국수를 만들고, 태국과 필리핀에서 건면을 수입해서 만들지 않습니다.’ 이를 구글 번역을 이용해 영어로 번역하고, 그 뜻을 다시 한국어로 바꾸니 다음과 같이 나왔다. ‘우린 매일 아침 태국과 필리핀에서 수입하는 면으로 쌀국수를 만듭니다’. 번역 한 번 거쳤을 뿐인데, 처음과 완전히 다른 뜻이 됐다.


이정수 대표는 사람을 통한, 집단지성을 활용한 번역 서비스로 이런 장벽을 해소할 수 있다고 믿는다. 한 명이 100장을 번역하는 데 시간이 오래 걸릴 수 있다. 그러나 100명이 한 줄씩 번역하면 기계보다 훨씬 더 정확하게 번역을 하면서 시간도 줄일 수 있다.


flitto service


현재 플리토는 집단지성 번역 서비스와 일대일 전문 번역 서비스를 제공한다. 집단지성 서비스는 사용자 간 포인트를 통해 번역을 요청하고 받을 수 있는 서비스다. 글 뿐 아니라 이미지, 음성자료도 모두 번역할 수 있다. 신용카드, 휴대폰 결제, 페이팔 등으로 번역에 필요한 포인트를 구입하거나, 번역가 활동을 통해 포인트를 쌓아 서비스를 이용할 수 있다.


번역가 활동을 많이 하면 별이 늘어나면서 자신이 올린 번역이 채택될 가능성도 커진다. 앞서 언급했듯이 이정수 대표는 본인이 손수 자신이 만든 서비스에 번역가로 참여해 활동하면서 별을 늘려나갔다.


일대일 전문 번역 서비스는 성격이 좀 다르다. 요청자가 전문번역가에게 일대일로 번역을 의뢰하는 방식이다. 요청자가 원하는 조건을 설정해 본인 입맛에 맞는 번역가를 고를 수 있다. 지난 6월 기준 전문 번역 하루 처리 건수는 150건 이상, 만족도는 5점 만점에 평균 4.8을 기록할 정도로 높은 반응을 얻고 있다.


이정수 대표는 모든 것이 기계로 가고 있을 때 사람으로 역행하는 서비스가 사랑받는 이유엔 ‘정확성’이 존재한다고 바라본다. 믿고 맡길 수 있는 번역 서비스를 누리고 싶은 시장이 존재하고, 기존 기계 번역으로는 이런 사용자 요구를 충족할 수 없었다. 그 시장에 플리토는 기계가 아닌 사람을 통해 그 사람이 하고 싶은 말을 정확하게 풀이해 보여준다. 더 정확한 번역을 위해 하나의 요청을 300명에게 전달하는 식으로 서비스를 구성했다. 사용자가 자기 뜻에 맞는 번역을 선택할 수 있게 유도한다.


“망상일 수 있겠지만, 우리가 원하는 세상은 아예 언어 장벽이 무너지는 세상입니다. 지금은 텍스트 중심으로 번역하고 있지만, 자리를 잡으면 증강현실(AR) 기술을 이용해 사용자가 플리토 앱을 어디에나 갖다대기만 하면 번역이 이뤄지는 서비스를 꿈꾸고 있습니다.”


집단지성으로 얻은 번역, 코퍼스로 만들어 수익 창출


번역 서비스 4년 차, 이정수 대표는 또 다른 목표를 세웠다. 지금까지 집단지성에 기반을 둔 번역 서비스를 운영하는 데 집중했다면, 이제는 번역 플랫폼으로서의 성장 가능성도 고민하기 시작했다.


“성장하려면 가지가 많아서는 안됩니다. 줄기가 있어야지요. 구글은 검색엔진에 집중하고, 페이스북은 소셜미디어에 집중해서 다양한 서비스 가지를 만들어나가듯이 저희도 ‘번역’이라는 큰 줄기를 가지고 작문, 콘텐츠, 여행, 전문가 영역 등 다양하게 서비스를 확대할 수 있을 것이라 기대하고 있습니다. 단순 번역 서비스가 아니라 번역 플랫폼을 제공하려는 이유지요.”


플랫폼 서비스로 키우기 위해 이정수 대표는 코퍼스, 한글 말뭉치를 만드는 작업에 집중하고 있다. 한글 말뭉치는 일종의 한글 어휘와 어휘 특성의 저장소다. 일반적으로 문서를 디지털화한 뒤 해당 문서에 사용된 모든 어휘를 문장, 어절, 형태소별로 추려내고 각각에 특성을 부여하는 식이다. 이를 개발용어로 코퍼스라고 한다. 이 작업이 선행되어야 자동 번역 서비스를 할 때 다양한 언어 형태를 컴퓨터가 이해해 해석할 수 있다. 기존에는 형태소 분석을 통해서 추려내는 게 대부분이었다. 번역된 문장이 다소 어색한 이유엔 정해진 코퍼스에 맞춰 뜻을 해석해 결과값을 만들기 때문이다.


꼬꼬마 세종 말뭉치 검색 시스템 개요.(출처 : 이동주 등.(2010))

꼬꼬마 세종 말뭉치 검색 시스템 개요.(출처 : 이동주 등.(2010))


“저흰 형태소뿐 아니라 문장도 함께 분석합니다. 코퍼스를 분석해서 해당 코퍼스와 일치하는 결과만 제공하는 게 아니라 50~60% 비슷한 문장도 함께 보여주는 서비스를 생각하고 있습니다. 지금 현재 코퍼스를 2천만개 만들었는데, 이를 1억개 정도로 늘리는 게 목표입니다.”


예를 들어 다음 문장을 살펴보자. ‘화장실은 어디입니까’라는 문장을 영어로 번역하고 싶다고 하자. 기존 자동번역은 해당 문장을 코퍼스로 나눈 다음 해당 코퍼스와 일치하는 영어 단어를 배열해서 보여준다. 이정수 대표는 여기서 좀 더 나아갔다. 단순히 코퍼스와 일치하는 문장만 보여주기보다는 ‘여기서 가까운 화장실은 어디입니까’, ‘화장실에 가고 싶어요’ 등 유사 코퍼스로 이뤄진 문장도 함께 보여주는 법을 고민 중이다. 단순히 뜻을 전달하는 번역보다 그 사람의 미묘한 기분도 함께 담을 수 있는 번역에 집중했다.


“같은 뜻을 전달하고 싶어도 그 말의 의미와 뉘앙스가 조금 다를 수 있잖아요. 그 부분을 살려보겠다는 생각이에요. ‘디스커버리’ 같은 SNS 데이터에 집중해서 하루에 10만개가 넘는 말뭉치를 모으는 이유입니다.”


플리토는 ‘디스커버리’라고 하는 스타 SNS 내용을 번역해서 보여주는 소셜 서비스도 함께 운영 중이다. 처음엔 저작권 걱정 없이 번역을 제공할 도구가 무엇인지 고민하다, 스타들의 SNS는 저작권이 없다는 데서 시작했다고 한다. 그러나 디스커버리를 통해 번역가로 활동하는 사람들이 자발적으로 번역에 나서면서, 신조어나 사람들이 활발하게 사용하고 있는 코퍼스를 모으는 중요한 소통 창구로 자리잡게 됐다.


“우리 최종 목표는 코퍼스 데이터를 모으는 데 있습니다. 양적으로 우수한 데이터를 끊임없이 확보할 수 있게 됐지요. 이 데이터에 대한 시장 요구가 존재해서, 코퍼스 데이터 판매를 통해 수익을 올리기도 합니다.”


그 외에도 플리토는 증강현실 번역을 현실화하는 계획도 세웠다. 출장 갈 때 여행하듯이, 해당 국가 언어를 몰라도 의사소통하는 데 문제 없는 플랫폼을 만들어 나가는 게 그의 목표다. 증강현실 기술과 광학문자인식(OCR) 기술, 통신 기술을 활용해 더욱 빠른 증강현실 번역을 만든다는 계획이다. 현재 내부 테스트에선 증강현실로 텍스트를 인식해 번역이 이뤄지기까 약 3초가 걸린다. 이정수 대표는 이 시간을 1초 이하로 줄이는 게 목표다.


“지금 구글 증강현실 번역이 약 2초 정도 시간이 걸린다고 하더군요. OCR로 글자를 추려내는 데 1초, 그 글자와 위치에 따라 이미지를 DB에서 찾아내 매칭하는 데 1초가 걸리는 식이더군요. 결국, 이 작업을 하려면 자체 번역 DB를 구축해야 한다는 생각이 들었습니다. 그래서 데이터를 모으는 데 집중하고 있지요.”


플리토가 생각하는 증강현실 번역은 집단지성을 연장했다. 개개인이 번역을 원하는 이미지 데이터를 모은 다음 이를 증강현실 번역 시스템으로 완성해 나가는 게 최종 목표다. 이 과정에서 위치 데이터 정보도 함께 수집한다. 그렇게 되면 OCR로 텍스트 값을 읽음과 동시에 위치 정보를 파악해, 앞서 번역이 된 문장이 있으면 해당 데이터를 보여주는 식이다. 증강현실 번역이 바로바로 이뤄지는 식이다.


“저희가 원하는 건 명백합니다. 언어 장벽을 무너뜨리고 싶습니다. 언어 장벽을 무너뜨리면 인류 역사에 큰 획을 그을 수 있다고 생각합니다. 지금까지는 이 과정이 순탄하게 잘 진행되고 있습니다. 앞으로 더 열심히 하려고 합니다.”


(왼쪽 아래부터 시계방향 순으로) 이정수 플리토 대표, 김연주 CS 담당, Inna Karmolit 러시아어권 마케팅 담당, 정효찬 안드로이드 개발자, 안도익 B2B 담당

이정수 플리토 대표, 김연주 CS 담당, Inna Karmolit 러시아어권 마케팅 담당, 정효찬 안드로이드 개발자, 안도익 B2B 담당
(왼쪽 아래부터 시계방향으로)




크리에이티브 커먼즈 라이선스 (주)블로터앤미디어에 의해 작성된 이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.


[원문출처 : http://www.bloter.net/archives/261458]

맨 위로
맨 위로