영어 몰라도 괜찮아…AI 번역 데이터 150만개 개방
OSS관리자
게시글 작성 시각 2019-04-03 09:49:15
4월 3일
ⓒ 전자신문, 최종희 기자 / choijh@etnews.com
영어 문장을 한글로 해석한 번역 데이터 150만개가 오는 11월 일반에 개방된다. 데이터 수급에 애를 먹는 스타트업이 숨통을 틀 수 있게 됐다. 인공지능(AI) 기반 한영·영한 번역 기술을 고도화하는 데 기여할 전망이다.
한국정보화진흥원(NIA)은 오는 11월 150만개에 달하는 번역 데이터를 공개할 계획이라고 2일 밝혔다. 대상은 뉴스 80만개, 대화체 문장 50만개다. 법률과 한국 문화 관련 문장도 10만개씩 포함됐다. 진흥원이 운영하는 'AI허브' 사이트를 통해 회원가입 후 누구나 내려받을 수 있다. 정부 차원에서 150만개 규모 데이터를 개방하는 것은 해외에도 전례가 없다는 것이 NIA 측 설명이다.
NIA 관계자는 “기계번역 수준이 아직 원어민이나 전문 통·번역가에는 못 미친다”며 “번역 데이터의 산업 가치를 높게 평가, 데이터 구축 사업을 시작했다”고 말했다.
데이터가 풀리면 다양한 AI 서비스가 나올 것으로 기대된다. 데이터 수급에 어려움을 겪던 스타트업에게도 기회다. 지금까지는 데이터를 구하려면 직접 번역문을 만들거나 돈을 주고 매입해야 했다. 문장 100만개를 구입하는 데 최소 5억원이 든다.
(후략)
[원문출처 : http://www.etnews.com/20190402000143 ]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 363337 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 353153 | 2020-10-27 |
8369 | 레드팀을 위한 표준 툴? 모의 해킹 툴셋 무료로 공개 | 5221 | 2019-04-05 |
8368 | “R3는 세상을 바꾸고 싶다…답은 오픈소스 블록체인” | 4776 | 2019-04-05 |
8367 | "SW기업이 오픈소스에 사활을 거는 이유는 결국 수익성" | 4987 | 2019-04-05 |
8366 | 정부, 경쟁력 갖춘 SW연구소 키운다…SW스타랩 7개 선정·발표 | 4792 | 2019-04-04 |
8365 | "해커를 잡는 덫" 허니팟의 이해 | 5495 | 2019-04-04 |
8364 | 익스트림, SW·자동화·AI 집중 투자…‘자율적 기업’ 구현 앞장 | 4734 | 2019-04-04 |
8363 | 영어 몰라도 괜찮아…AI 번역 데이터 150만개 개방 | 5116 | 2019-04-03 |
8362 | "무역분쟁도 막을 수 없다"…구글·화웨이의 'AI 콜라보' | 4915 | 2019-04-03 |
8361 | 손태승 행장, 개방형 혁신 ‘오픈 파이낸스’로 승부 | 5104 | 2019-04-03 |
8360 | 마이크로소프트, 파이썬용 '파이라이트' 공개… "기존 타입체커보다 5배 빨라" | 4404 | 2019-04-02 |
0개 댓글