본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

빅데이터, 오픈소스로 공유하자

OSS 게시글 작성 시각 2017-10-25 09:00:50 게시글 조회수 4850

2017년 10월 25일 (수)

ⓒ 지디넷코리아, 김우용 기자


리눅스재단, CDLA 공개…"공개 데이터 양성"


오픈소스 소프트웨어 개발처럼 데이터도 오픈소스로 관리하는 체계가 나와 주목받고 있다. 일부 기업이나 조직이 독점하는 빅데이터를 오픈소스로 공유해 협업을 확산시켜야 한다는 주장이다.


미국 지디넷에 따르면, 리눅스재단은 최근 열린 오픈소스서밋유럽에서 공개 데이터 라이선스 체계인 '커뮤니티 데이터 라이선스 어그리먼트(CDLA)'를 발표했다. [홈페이지 바로가기]


CDLA는 오픈소스 기반 소프트웨어 개발처럼 오픈 데이터 저작권을 관리하는 라이선스 프레임워크다. 커뮤니티 간 협업을 지원해 공개 데이터를 양성하고 공유하는 것을 목표로 한다.



CDLA 라이선스는 개인과 조직이 오픈소스 코드를 공개하는 것처럼 단순하게 데이터를 공유할 수 있도록 돕는다. 이 라이선스 모델은 커뮤니티를 조직하고, 관리하면서 빅데이터를 유지할 수 있도록 한다.


재단측은 데이터 기반 커뮤니티나 사업이 등장하고, 공개 데이터 기반 애플리케이션이 증가할 것으로 기대하고 있다.


■ 정부-교육기관-사업체 데이터 공유 유도


빅데이터는 하둡, 스파크, 몽고DB 같은 관련 오픈소스 소프트웨어의 덕분에 유용한 정보로 재평가 받을 수 있었다. 하지만, 오픈소스 빅데이터 툴을 활용해 가치를 창출하기 위한 데이터를 확보하기 어렵다는 점이 극복해야 할 과제로 꼽혔다.


CDLA 라이선스는 정부, 교육기관, 사업체 등 데이터를 공개하고 공유하는 조직을 돕기 위해 디자인됐다. 가능한 많은 데이터를 쉽게 개방하고 공동관리할 수 있는 제반 여건을 마련하자는 것이다.


재단측은 "자동차 제조사, 유통 사업자, 도시 인프라 서비스는 데이터를 공유해 안전과 에너지 절감, 예측적 유지보수 등을 개선할 수 있을 것"이라며 "자율주행차는 내비게이션용 인공지능 시스템에 거의 의존하고, 적절한 기능을 위해 대규모 데이터를 필요로 한다"고 예를 들었다.


이어 "일단 길 위에서 그들은 매초당 기가바이트의 데이터를 생성할 수 있다"며 "평균적인 자동차가 센서, 오디오, 비디오, 기타 등등에서 매년 2페타바이트의 데이터를 만들어낸다"고 설명했다.


다양한 조직들이 데이터를 공유할 일은 점차 늘어날 전망이다. 그러나 조직마다 데이터를 관리하는 체계와 공유 정책이 다르다. 이는 여러 조직의 데이터 관련 협업을 가로막는다. CDLA는 이같은 문제를 해결하기 위한 일종의 데이터 공유 표준 역할을 하게 된다.


마크 래드클리프 DLA파이퍼 FOSS프랙티스그룹 파트너 및 글로벌 의장은 "데이터의 법적 보호와 라이선싱은 아직 유아기에 있다"며 "현존 여러 라이선스는 데이터를 사용하고 라이선싱하는 시도에서 모순적이고, 때로 불완전하다"고 설명했다.


그는 "CDLA는 데이터 사용과 라이선싱을 관리하려는 회사들과 법률가에게 가치있는 툴을 제공한다"며 "오픈소스 커뮤니티의 가장 좋은 방식 속에서 리눅스재단은 최고의 실현가능한 합의를 얻는 협업 프로세스를 사용해왔다"고 덧붙였다.


■ 공유 라이선스-방임적 라이선스 두 종류로 운영 


CDLA 라이선스는 '공유 라이선스(Sharing)', '방임적 라이선스(permissive)' 등 두가지 종류다.


공유 라이선스는 데이터 커뮤니티에 새로운 기여를 하도록 장려하지만, 반드시 요구하진 않는다. 이는 리눅스의 GPLv2와 유사하다. 방임적 라이선스는 오픈 데이터 수령자나 기여자에게 추가적인 공유를 강제하지 않는다. BSD 라이선스와 유사하다.


CDLA 라이선스는 가치있는 데이터세트를 공유하려는 회사, 조직, 커뮤니티 등의 필요에 의해 제안됐다. 이 라이선스는 기부자와 소비자들이 공개된 데이터세트를 활발히 사용하고, 또다른 데이터 기부를 유도하려는 의도를 갖고 있다. 리스크를 공유하고 제거하는 조항을 명확히 하려는 목적도 가졌다.


이 라이선스는 프레임워크일 뿐이다. 또한 데이터 프라이버시에 대한 고려도 부족하다. 오로지 데이터 공유자와 관리자에게 프라이버시에 대한 거버넌스 구조를 수립하는데 의존한다. 각 데이터 생산자와 큐레이터는 사법적 요구사항과 법적 이슈를 넘기 위한 작업을 해야 한다. 리눅스재단은 CDLA의 글로벌 채택을 독려하기 위해 특정한 법률이나 사법조항에 특화되지 않게 했다고 설명했다.


짐 젬린 리눅스재단 총괄이사는 "오픈 데이터 라이선스는 중요 기술과 사회적 혜택에 힘을 줄 데이터의 마찰없는 공유를 위한 기초"라며 "오픈소스 소프트웨어의 성공은 사람들이 함께 자원을 공유하고, 공익을 위해 진보할 때 달성할 수 있는 강력한 예시를 제공한다"라고 강조했다.




※ 본 내용은 (주)메가뉴스(http://www.zdnet.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ 지디넷코리아. 무단전재 및 재배포 금지


[원문출처 : http://www.zdnet.co.kr/news/news_view.asp?artice_id=20171025105739]

맨 위로
맨 위로