본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

MS 클라우드 ‘애저’, 한국 문학 연구 도우미로

OSS 게시글 작성 시각 2017-03-31 05:54:00 게시글 조회수 3736

2017년 3월 29일 (수)

ⓒ 블로터닷넷, 이경은 기자 kelee@bloter.net



애저 클라우드가 한국 문학 연구에 새로운 빛을 밝히는 데 도움을 주고 있다. 한국의 문학 유산 전승을 돕는 ‘문(Mo文oN)’ 프로젝트가 마이크로소프트 애저 클라우드에서 구축을 시작했다.


기존 고서 및 근·현대 문학 자료는 디지털화가 활발히 진행돼 있지 않았다. 이런 문제 때문에 연구학자는 폭넓은 연구를 진행할 수 없어 불편을 겪고 있었다. 국회도서관에서 자료의 디지털화를 진행하기는 했으나, 이미지 형태로 변환하는 스캔 방식이라 검색을 할 수 없어 제대로 활용하기가 힘들었다.


20여년 간 한국 문학을 연구해온 웨인 드 프레메리 서강대학교 국제한국학과 교수는 이런 어려움을 개선하고자 고문서와 자료의 글자를 인식하는 프로그램을 만들어 문 프로젝트를 기획했다. 그리고 올해 2월 마이크로소프트가 필란트로피즈 활동의 하나로 발표한 ‘클라우드 포 굿‘ 지원 프로그램에 9개 프로젝트 중 하나로 선정되면서, 문 프로젝트를 애저 클라우드에서 구축할 기회가 생겼다. 마이크로소프트 애저가 제공하는 고급 분석, 머신러닝, 인공지능을 개발에 활용할 수도 있게 됐다.


쉽고 빠른 검색으로 연구에 드는 시간 줄여


문 프로젝트는 기존에 검색할 수 없던 스캔 이미지 형태의 PDF가 가진 한계를 극복해 한글은 물론 20세기 이전의 근대 국어, 한문에 이르기까지 서체에 상관없이 모든 텍스트를 손쉽게 검색할 수 있게 했다.


‘문(Mo文oN)’ 프로젝트를 통해 김소월 시인의 '진달래꽃' 글자를 이미지로 캡처하는 모습

‘문(Mo文oN)’ 프로젝트를 통해 김소월 시인의 시집 ‘진달래꽃’에서 한자 ‘뫼 산(山)’을 검색한 결과


김소월의 시 ‘진달래꽃’을 살펴보자. 이 시에 ‘사뿐히 즈려 밟고 가시옵소서’라는 문구가 나온다. 여기에서 ‘즈려 밟고’에 대한 해석은 아직도 분분하다. 현대 국어에는 없는 표현이기 때문이다. 이 표현의 제대로 된 의미를 알기 위해서는 다른 시집이나 수많은 자료를 통해 이 표현이 쓰인 문맥을 찾아 분석해야 한다. 하지만 한 사람이 수천, 수만 페이지에 이르는 문서를 일일이 확인하기에는 어려움이 있다. 문 프로젝트는 자료의 데이터화로 쉽고 정확한 검색을 할 수 있게 해 고문서의 활용도를 높이고 연구에 드는 시간을 줄인다.


텍스트를 3D로 재해석해 문학으로의 색다른 접근법 제시


문 프로젝트는 시의 구절을 3D 형태로 제작할 수 있는 기능도 포함하고 있다. 예를 들어 시 ‘진달래꽃’을 이루고 있는 한글 자모, 한자 획, 띄어쓰기 등에 각각의 코드를 매길 수 있다. 이렇게 나온 코드를 3D 프린터로 출력하면 각각의 값에 따라서 텍스트였던 시가 새로운 조형물로 탄생하게 된다. 목걸이나 반지 같은 악세사리로도 만들 수 있고 인테리어 소품처럼 재현될 수도 있다.


(Mo文oN)’ 프로젝트 조형물. 조형물의 모양은 시마다 다른 형태로 재현될 수 있다.

3D 모델로 재해석한 ‘문(Mo文oN)’ 프로젝트 조형물. 조형물의 모양은 시마다 다른 형태로 재현될 수 있다.


문 프로젝트로 ‘홀로렌즈’와 같은 혼합현실(MR) 기기로 학생이나 일반인들이 직접 체험할 수 있는 3D 교육 공간도 만들 수 있다. 이 같은 문학의 3D 재해석엔 한국인들이 고전과 시문학에 더 많은 관심을 가질 수 있도록 돕고자 하는 웨인 교수의 바람이 담겨 있다.


한국 문학 연구 위한 공유플랫폼


문 프로젝트는 국회도서관과의 협력으로 많은 양의 고문서와 근·현대 문학 자료를 데이터화해 누구나 어디서든 자유롭게 연구할 수 있는 공유 플랫폼을 구축하고자 한다. 아직은 시작 단계이지만, 문 프로젝트가 정식으로 출범하면 불필요한 시간을 줄여 연구에 더욱 집중할 수 있는 환경을 만들고 고문서 연구 범위를 확장할 수 있을 것으로 기대된다.


서강대 웨인 드 프레메리 교수

서강대 웨인 드 프레메리 교수


웨인 교수는 “현재 전 세계적으로 보존이 어려운 고문서 및 옛 문학을 디지털화해 보존하는 추세지만, 이를 실질적으로 활용하기 어렵다는 한계점이 있어, 이러한 상황을 해결하고 한국학 연구 토대를 마련하고자 문 프로젝트를 시작하게 됐다”라며 “향후 애저 머신러닝과 인공지능 기술을 접목해 한국학과 한국문학에 특화된 검색엔진으로 발전시키는 동시에 한국 문학의 아름다움을 새롭게 느낄 수 있도록 하는 것이 목표”라고 말했다.


한국마이크로소프트 필란트로피즈 총괄 박선정 변호사는 “클라우드 컴퓨팅은 산업 전반에 걸쳐 핵심 자원으로 부상하여 경제적으로 큰 영향을 미치고 있지만, 아직 많은 연구자 및 비영리 단체에까지 이러한 기술의 혜택이 닿지 못하고 있다”라며 “마이크로소프트는 기술의 발전이 경제적인 측면 외에도 사회, 문화적인 측면에도 기여해야 한다는 철학을 기반으로 이번 프로젝트를 지원하게 됐다”라고 말했다.




크리에이티브 커먼즈 라이선스 (주)블로터앤미디어에 의해 작성된 이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.


[원문출처 : http://www.bloter.net/archives/275526]

맨 위로
맨 위로