Home > 열린마당 > 공개SW 소식

공개SW 소식

4월 3일

ⓒ 전자신문, 최종희 기자 / choijh@etnews.com

 

영어 문장을 한글로 해석한 번역 데이터 150만개가 오는 11월 일반에 개방된다. 데이터 수급에 애를 먹는 스타트업이 숨통을 틀 수 있게 됐다. 인공지능(AI) 기반 한영·영한 번역 기술을 고도화하는 데 기여할 전망이다.

 

한국정보화진흥원(NIA)은 오는 11150만개에 달하는 번역 데이터를 공개할 계획이라고 2일 밝혔다. 대상은 뉴스 80만개, 대화체 문장 50만개다. 법률과 한국 문화 관련 문장도 10만개씩 포함됐다. 진흥원이 운영하는 'AI허브' 사이트를 통해 회원가입 후 누구나 내려받을 수 있다. 정부 차원에서 150만개 규모 데이터를 개방하는 것은 해외에도 전례가 없다는 것이 NIA 측 설명이다.

 

NIA 관계자는 기계번역 수준이 아직 원어민이나 전문 통·번역가에는 못 미친다번역 데이터의 산업 가치를 높게 평가, 데이터 구축 사업을 시작했다고 말했다.

 

데이터가 풀리면 다양한 AI 서비스가 나올 것으로 기대된다. 데이터 수급에 어려움을 겪던 스타트업에게도 기회다. 지금까지는 데이터를 구하려면 직접 번역문을 만들거나 돈을 주고 매입해야 했다. 문장 100만개를 구입하는 데 최소 5억원이 든다.

(후략)

 

[원문출처 : http://www.etnews.com/20190402000143 ]

공개SW 소식 게시물 리스트 표
번호 제목 조회수 작성
공지 [주간 OSS 동향 리포트] 2019 SW주간, 오픈소스 트렌드부터 개방형OS까지 219 2019-12-08
공지 [주간 OSS 동향 리포트] 한·중·일, 빅데이터·5G·인공지능의 3국 간 협업 프로젝트 추진 위해 협력 1030 2019-11-26
공지 [주간 OSS 동향 리포트] 개발자를 위한 오픈소스 프로젝트 활용팁 1163 2019-11-20
공지 [주간 OSS 동향 리포트] 금융권 통합 오픈API 플랫폼 선보여 …오픈소스 기반 자체개발 주목 1130 2019-11-17
8366 정부, 경쟁력 갖춘 SW연구소 키운다…SW스타랩 7개 선정·발표 353 2019-04-04
8365 "해커를 잡는 덫" 허니팟의 이해 319 2019-04-04
8364 익스트림, SW·자동화·AI 집중 투자…‘자율적 기업’ 구현 앞장 326 2019-04-04
8363 영어 몰라도 괜찮아…AI 번역 데이터 150만개 개방 432 2019-04-03
8362 "무역분쟁도 막을 수 없다"…구글·화웨이의 'AI 콜라보' 357 2019-04-03
8361 손태승 행장, 개방형 혁신 ‘오픈 파이낸스’로 승부 422 2019-04-03
8360 마이크로소프트, 파이썬용 '파이라이트' 공개… "기존 타입체커보다 5배 빨라" 357 2019-04-02
8359 포항공대-연세대 국내 첫 블록체인 캠퍼스 만든다 363 2019-04-02
8358 클라우드시장에서 아마존과 구글, MS에 도전장을 던진 짐 화이트허스트 레드햇 회장 282 2019-04-02
8357 "AI, 인터넷처럼 자연스럽게 일상 곳곳에 자리할 것" 306 2019-04-01
맨 위로
맨 위로