본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

4월 3일

ⓒ 전자신문, 최종희 기자 / choijh@etnews.com

 

영어 문장을 한글로 해석한 번역 데이터 150만개가 오는 11월 일반에 개방된다. 데이터 수급에 애를 먹는 스타트업이 숨통을 틀 수 있게 됐다. 인공지능(AI) 기반 한영·영한 번역 기술을 고도화하는 데 기여할 전망이다.

 

한국정보화진흥원(NIA)은 오는 11150만개에 달하는 번역 데이터를 공개할 계획이라고 2일 밝혔다. 대상은 뉴스 80만개, 대화체 문장 50만개다. 법률과 한국 문화 관련 문장도 10만개씩 포함됐다. 진흥원이 운영하는 'AI허브' 사이트를 통해 회원가입 후 누구나 내려받을 수 있다. 정부 차원에서 150만개 규모 데이터를 개방하는 것은 해외에도 전례가 없다는 것이 NIA 측 설명이다.

 

NIA 관계자는 기계번역 수준이 아직 원어민이나 전문 통·번역가에는 못 미친다번역 데이터의 산업 가치를 높게 평가, 데이터 구축 사업을 시작했다고 말했다.

 

데이터가 풀리면 다양한 AI 서비스가 나올 것으로 기대된다. 데이터 수급에 어려움을 겪던 스타트업에게도 기회다. 지금까지는 데이터를 구하려면 직접 번역문을 만들거나 돈을 주고 매입해야 했다. 문장 100만개를 구입하는 데 최소 5억원이 든다.

(후략)

 

[원문출처 : http://www.etnews.com/20190402000143 ]

맨 위로
맨 위로