Home > 열린마당 > 공개SW 소식

공개SW 소식

4월 3일

ⓒ 전자신문, 최종희 기자 / choijh@etnews.com

 

영어 문장을 한글로 해석한 번역 데이터 150만개가 오는 11월 일반에 개방된다. 데이터 수급에 애를 먹는 스타트업이 숨통을 틀 수 있게 됐다. 인공지능(AI) 기반 한영·영한 번역 기술을 고도화하는 데 기여할 전망이다.

 

한국정보화진흥원(NIA)은 오는 11150만개에 달하는 번역 데이터를 공개할 계획이라고 2일 밝혔다. 대상은 뉴스 80만개, 대화체 문장 50만개다. 법률과 한국 문화 관련 문장도 10만개씩 포함됐다. 진흥원이 운영하는 'AI허브' 사이트를 통해 회원가입 후 누구나 내려받을 수 있다. 정부 차원에서 150만개 규모 데이터를 개방하는 것은 해외에도 전례가 없다는 것이 NIA 측 설명이다.

 

NIA 관계자는 기계번역 수준이 아직 원어민이나 전문 통·번역가에는 못 미친다번역 데이터의 산업 가치를 높게 평가, 데이터 구축 사업을 시작했다고 말했다.

 

데이터가 풀리면 다양한 AI 서비스가 나올 것으로 기대된다. 데이터 수급에 어려움을 겪던 스타트업에게도 기회다. 지금까지는 데이터를 구하려면 직접 번역문을 만들거나 돈을 주고 매입해야 했다. 문장 100만개를 구입하는 데 최소 5억원이 든다.

(후략)

 

[원문출처 : http://www.etnews.com/20190402000143 ]

공개SW 소식 게시물 리스트 표
번호 제목 조회수 작성
공지 [주간 OSS 동향 리포트] 금융권 통합 오픈API 플랫폼 선보여 …오픈소스 기반 자체개발 주목 38 2019-11-17
공지 [주간 OSS 동향 리포트] 디지털 정부혁신, 오픈소스 중심의 개방형 생태계 마련 510 2019-11-10
공지 [주간 OSS 동향 리포트] 서울 중랑구, 오픈소스 기반 IoT 통합 플랫폼 구축사업 추진 804 2019-10-29
공지 [주간 OSS 동향 리포트] 기업이 오픈소스를 꼭 이용해야 하는 이유 820 2019-10-23
공지 [주간 OSS 동향 리포트] "살상 무기에 오픈소스 쓰지 말라"··· '히포크라테스 라이선스' 제안 화제 860 2019-10-15
8370 디지털에셋 ‘오픈소스’ 전략 채택 251 2019-04-09
8369 레드팀을 위한 표준 툴? 모의 해킹 툴셋 무료로 공개 358 2019-04-05
8368 “R3는 세상을 바꾸고 싶다…답은 오픈소스 블록체인” 286 2019-04-05
8367 "SW기업이 오픈소스에 사활을 거는 이유는 결국 수익성" 266 2019-04-05
8366 정부, 경쟁력 갖춘 SW연구소 키운다…SW스타랩 7개 선정·발표 321 2019-04-04
8365 "해커를 잡는 덫" 허니팟의 이해 283 2019-04-04
8364 익스트림, SW·자동화·AI 집중 투자…‘자율적 기업’ 구현 앞장 290 2019-04-04
8363 영어 몰라도 괜찮아…AI 번역 데이터 150만개 개방 396 2019-04-03
8362 "무역분쟁도 막을 수 없다"…구글·화웨이의 'AI 콜라보' 320 2019-04-03
8361 손태승 행장, 개방형 혁신 ‘오픈 파이낸스’로 승부 379 2019-04-03
맨 위로
맨 위로