2017년 2월 21일 (화)
ⓒ 아이뉴스24, 김국배기자
신조어, 전문용어 포함 93만 단어 수록
한국정보화진흥원(NIA)은 빅데이터 관련 서비스 개발을 지원하기 위해 형태소 사전을 제작해 공개한다고 21일 발표했다.
형태소는 일정한 뜻(의미)을 지닌 가장 작은 말의 단위로 한글 텍스트 분석을 통해 다양한 의미를 추출하기 위해선 형태소별 품사를 구분해 작성한 형태소 사전이 필수다.
93만 단어가 수록된 NIA의 형태소 사전 'NIADic'은 국립국어원의 우리말 샘 사전을 바탕으로 제작됐으며 기존에 써온 '세종Dic(9만 단어)'에 신조어와 법률, 의료 등 6대 분야별 전문 단어를 추가해 빈도수, 연관분석 측면에서 의미있는 데이터 분석이 가능해졌다.
NIA 측은 "향후 NIADic은 공개 소프트웨어 커뮤니티에 오픈소스로 개방돼 통계분석 도구와 분석기 사용자들이 자율적으로 업데이트해 활용할 수 있다"며 "저작자와 출처 등을 표시하면 영리 목적의 이용이나 변경, 2차 저작물 작성을 포함해 상업적 활용이 가능하기 때문에 한글 빅데이터 분석 분야 연구가 보다 활발해질 것"이라고 기대했다.
형태소는 일정한 뜻(의미)을 지닌 가장 작은 말의 단위로 한글 텍스트 분석을 통해 다양한 의미를 추출하기 위해선 형태소별 품사를 구분해 작성한 형태소 사전이 필수다.
93만 단어가 수록된 NIA의 형태소 사전 'NIADic'은 국립국어원의 우리말 샘 사전을 바탕으로 제작됐으며 기존에 써온 '세종Dic(9만 단어)'에 신조어와 법률, 의료 등 6대 분야별 전문 단어를 추가해 빈도수, 연관분석 측면에서 의미있는 데이터 분석이 가능해졌다.
NIA 측은 "향후 NIADic은 공개 소프트웨어 커뮤니티에 오픈소스로 개방돼 통계분석 도구와 분석기 사용자들이 자율적으로 업데이트해 활용할 수 있다"며 "저작자와 출처 등을 표시하면 영리 목적의 이용이나 변경, 2차 저작물 작성을 포함해 상업적 활용이 가능하기 때문에 한글 빅데이터 분석 분야 연구가 보다 활발해질 것"이라고 기대했다.
※ 본 내용은 (주)아이뉴스24(http://www.inews24.com)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ 아이뉴스24. 무단전재 및 재배포 금지
[원문출처 :http://news.inews24.com/php/news_view.php?g_menu=020200&g_serial=1007751]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 293277 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 283910 | 2020-10-27 |
6383 | 페이스북, 무료 예측 툴 프로핏, 파이썬과 R용으로 오픈소스화 | 3880 | 2017-03-03 |
6382 | 빅데이터부터 블록체인까지···될성부른 오픈소스 프로젝트 8가지 | 3864 | 2017-03-03 |
6381 | [주간 OSS 동향 리포트] 미 국방부의 오픈소스 이니셔티브 ‘Code.mil’ | 3866 | 2017-03-02 |
6380 | [해외소식] 미 국방부의 오픈소스 이니셔티브 ‘Code.mil’ | 4067 | 2017-02-28 |
6379 | [해외소식] HPE-레드햇, 오픈소스 NFV 솔루션 제공 위해 협력 | 3734 | 2017-02-28 |
6378 | 스마트폰 인공지능 구글 어시스턴트, 이번 주부터 주요 영어권 국가 서비스 확대 | 4122 | 2017-02-28 |
6377 | "AI 이용해 악성 댓글 차단"··· 구글, '퍼스펙티브' API 공개 | 3757 | 2017-02-28 |
6376 | “자율주행차 기술 훔쳤다”…구글, 우버 제소 | 3944 | 2017-02-28 |
6375 | 그들은 어떻게 데이터 과학자가 됐나 | 3991 | 2017-02-28 |
6374 | NIA, 빅데이터 분석 위한 형태소 사전 공개 | 4512 | 2017-02-28 |
0개 댓글