영어 몰라도 괜찮아…AI 번역 데이터 150만개 개방
OSS관리자
게시글 작성 시각 2019-04-03 09:49:15
4월 3일
ⓒ 전자신문, 최종희 기자 / choijh@etnews.com
영어 문장을 한글로 해석한 번역 데이터 150만개가 오는 11월 일반에 개방된다. 데이터 수급에 애를 먹는 스타트업이 숨통을 틀 수 있게 됐다. 인공지능(AI) 기반 한영·영한 번역 기술을 고도화하는 데 기여할 전망이다.
한국정보화진흥원(NIA)은 오는 11월 150만개에 달하는 번역 데이터를 공개할 계획이라고 2일 밝혔다. 대상은 뉴스 80만개, 대화체 문장 50만개다. 법률과 한국 문화 관련 문장도 10만개씩 포함됐다. 진흥원이 운영하는 'AI허브' 사이트를 통해 회원가입 후 누구나 내려받을 수 있다. 정부 차원에서 150만개 규모 데이터를 개방하는 것은 해외에도 전례가 없다는 것이 NIA 측 설명이다.
NIA 관계자는 “기계번역 수준이 아직 원어민이나 전문 통·번역가에는 못 미친다”며 “번역 데이터의 산업 가치를 높게 평가, 데이터 구축 사업을 시작했다”고 말했다.
데이터가 풀리면 다양한 AI 서비스가 나올 것으로 기대된다. 데이터 수급에 어려움을 겪던 스타트업에게도 기회다. 지금까지는 데이터를 구하려면 직접 번역문을 만들거나 돈을 주고 매입해야 했다. 문장 100만개를 구입하는 데 최소 5억원이 든다.
(후략)
[원문출처 : http://www.etnews.com/20190402000143 ]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 435704 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 424630 | 2020-10-27 |
8364 | 익스트림, SW·자동화·AI 집중 투자…‘자율적 기업’ 구현 앞장 | 4797 | 2019-04-04 |
8363 | 영어 몰라도 괜찮아…AI 번역 데이터 150만개 개방 | 5187 | 2019-04-03 |
8362 | "무역분쟁도 막을 수 없다"…구글·화웨이의 'AI 콜라보' | 4980 | 2019-04-03 |
8361 | 손태승 행장, 개방형 혁신 ‘오픈 파이낸스’로 승부 | 5163 | 2019-04-03 |
8360 | 마이크로소프트, 파이썬용 '파이라이트' 공개… "기존 타입체커보다 5배 빨라" | 4487 | 2019-04-02 |
8359 | 포항공대-연세대 국내 첫 블록체인 캠퍼스 만든다 | 4294 | 2019-04-02 |
8358 | 클라우드시장에서 아마존과 구글, MS에 도전장을 던진 짐 화이트허스트 레드햇 회장 | 4735 | 2019-04-02 |
8357 | "AI, 인터넷처럼 자연스럽게 일상 곳곳에 자리할 것" | 4881 | 2019-04-01 |
8356 | 베잔트, 블록체인 개발 플랫폼 ‘베잔티움’ 개발 완료…내달 메인넷 출시 | 4545 | 2019-04-01 |
8355 | AI에 돈이 몰린다…미국도, 한국도 벤처캐피털 투자 급증 | 4543 | 2019-04-01 |
0개 댓글