Home > 열린마당 > 공개SW 소식

공개SW 소식

2014년 03월 13일 (목)

ⓒ 디지털데일리, 이상일 기자 2401@ddaily.co.kr




▲ 오픈프론티어랩 박치완 개발자


하둡(Hadoop)은 빅데이터 분석에 있어 각광받는 기술이지만 사용하기가 쉽지는 않다. 하지만 하둡의 성능 및 활용을 최대로 이끌어내기 위한 다양한 프로젝트가 이어지고 있어 하둡 생태계는 활성화되고 있다.


13 일 서울 양재동 엘타워에서 개최된 ‘오픈테크넷 서밋 2014’에서 ‘쓰기 쉬운 하둡(Hadoop) 기반 빅데이터 플랫폼 아키텍처 및 활용방안’을 발표한 오픈프론티어랩 박치완 개발자는 “빅데이터를 활용하기 위해서는 데이터 사용자가 자주, 빨리 분석을 수행해볼 수 있어야 한다. 하지만 아직은 하둡이 기존 시스템보다 다루기 어려운 것은 사실”이라고 설명했다.


오픈프런티어랩은 국내외 오픈소스 프로젝트를 수행하는 공개SW 커미터(Committer)를 지원하는 정부지원(정보통신산업진흥원) 프로그램이다. 


박 개발자는 “아파치 하둡이 소개된 이후 사용하기 어렵다는 지적을 보완하기 위해 다양한 기술이 나왔다”며 “하지만 터미널 위주의 데이터가 주를 이루다 보니 기존 환경에 익숙한 개발자들에겐 생소할 수 있다”고 설명했다.


이렇다보니 하둡 기술을 쉽게 사용할 수 있는 다양한 기술도 꾸준히 소개되고 있다.


박 개발자는 “하둡 클러스터를 쉽게 배포하고 관리해 줄 수 있는 ‘암바리(Ambari)’, 하둡관련 프로젝트를 하나로 묶어 사용할 수 있게 해주는 솔루션인 ‘클라우데라 휴(Cloudera Hue)’ 등 다양한 솔루션이 나오고 있어 하둡 생태계를 확장시키는데 도움을 주고 있다”고 설명했다.


한편 이 자리에서 오픈프론티어랩에서는 정부 지원을 받아 진행하고 있는 ‘플라밍고(Flamingo)’ 프로젝트를 소개했다. 플라밍고는 웹 기반 유저환경(UI)에서 하둡 컴포넌트를 다루는 것으로 하둡 개발환경에 생소한 개발자들고 편하게 다가갈 수 있게 해준다.


기능적으로 기존에 사용하던 맵리듀스(Mapreduce)에 통합해 워크플로우(Workflow)에 적용할 수 있고 하이브 테이블(Hive Table)은 쿼리(Query)문 없이 UI로만 가능하는 등 편의성이 강조된 기능이 채택됐다.


박 개발자는 “플라밍고에선 향후 기본적으로 제공되는 컴포넌트를 보강하는 한편 하둡 2.0 지원, 아마존 EMR 등 하둡 기반 엔터프라이즈 플랫폼을 지원할 계획”이라고 밝혔다.




※ 본 내용은 (주)디지털데일리(http://www.ddaily.co.kr)의 저작권 동의에 의해 공유되고 있습니다.

Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지


[원문출처 : http://www.ddaily.co.kr/news/article.html?no=116162]

맨 위로
맨 위로