본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

빅데이터·클라우드 “주목, 오픈소스”

OSS 게시글 작성 시각 2012-06-01 10:07:21 게시글 조회수 5829

2012년 05월 31일 (목)

ⓒ 블로터닷넷, 이지영 기자 izziene@bloter.net


올 한 해 가장 주목받거나 주목받을 정보과학 기술로 클라우드 컴퓨팅과 빅데이터 얘기가 빠지지 않는다. KT클라우드웨어와 넥스알이 이 두가지와 관련된 내용을 모두 들을 수 있는 자리를 마련했다. KT클라우드웨어는 오픈소스 기반의 클라우드 컴퓨팅 솔루션을 개발하고 구축하는 넥스알은 오픈소스 기반의 빅데이터 솔루션을 개발하고 구축하는 회사다.


두 회사는 5월31일 ‘오픈 클라우드&빅데이터 2012′ 행사를 통해 클라우드 컴퓨팅과 빅데이터 분야에서 오픈소스 기술이 어떻게 적용되고 있는지 사례를 들어 설명했다. 이날 행사는 하둡, 하이브, 플럼, H베이스, 카산드라, 엘라스틱서치, 주키퍼 같은 다양한 오픈소스에 대한 간략한 소개와 이를 어떻게 사내 적용했는지에 대한 각 회사별 발표를 중심으로 진행됐다.



“오픈소스 프로젝트, 꾸준한 참여가 중요해”


이날 기조연설은 한재선 넥스알 대표 겸 KT클라우드웨어 최고기술경영자가 맡았다. ‘클라우드 컴퓨팅과 빅데이터 기술을 주도하는 오픈소스의 힘’을 주제로 오픈소스 프로젝트를 할 때 개발자들이 염두해야 할 사항에 대해 설명했다. 특히 넥스알이 진행하고 있는 오픈소스 프로젝트인 ‘RHive’를 진행하면서 몸소 느낀 솔직한 경험담을 들려줬다.


“오픈소스 프로젝트할 때 가장 어렵게 생각할 분야가 뭔지 압니다. 영어겠지요. 오픈소스 프로젝트 대부분이 영어로 진행되나 보니 어떻게 설명을 넣을지 고민하는 개발자가 많은 것으로 압니다. 하지만 영어보다 중요한 게 무엇인지 아시나요. 시간과 도전입니다. 두려움에 서성거리는거보다 직접 프로젝트에 뛰어드는 게 훨씬 값어치 있다고 자신있게 말할 수 있습니다. 주의사항이 또 있습니다. 1년 이상 꾸준히 해야 합니다. 커밋에 대한 반응이 없더라도 꾸준히 하는 게 제일 중요합니다.”



넥스알이 페이스북을 만나 커미터가 되고 싶다는 의향을 밝혔을 때, 6개월 이상하고 커밋을 50개 이상 해야 한다는 답변을 받았다고 한다. 커미터는 오픈소스 프로젝트에 참여하거나 기여하는 사람을 일컫는 표현이다. 커밋은 오픈소스에 기여하는 코드나 패치로 이해하면 된다. 오픈소스 프로젝트를 발의한 사람은 이 커밋들을 살펴보면서 프로젝트 기여 정도로 판단해 커미터로 인정하는 식이다.


한재석 대표는 처음 4개월은 페이스북도 바쁜지 올린 커밋에 대한 그 어떤 의견도 나오지 않았으나 포기하지 않고 꾸준히 하니 올린 커밋에 대한 반응이 점차 올라왔다고 전했다. “지금까지 18개 정도 커밋했습니다. 이 쯤 되니 오픈소스 프로젝트 매니저는 단기적으로 활동하는 커미터를 싫어한다는 얘기를 접하게 됐습니다. 오픈소스 프로젝트에서 커미터가 되려면 최소 1년 동안 반응이 없어도 꾸준히 커밋을 올려야 한다더군요. 국내도 오프소스 프로젝트에 관심있는 분들이 많다고 들었습니다. 커미터가 되고 싶다면 1년 이상의 장기 전략을 구사하거나, 아예 신생 오픈소스 프로젝트에 참여하기를 추천합니다.”

오픈소스에 대한 꾸준한 참여는 한재선 대표가 사회를 보고 김영우 프로젝트 매니저와 김재흥 팀장, 전희원 넥스알 팀장이 진행한 ‘빅데이터와 클라우드에서의 오픈소스의 역할과 미래’ 패널토의에서도 다시금 강조됐다. 오픈소스 프로젝트는 일반 상용 솔루션을 구입해 활용하는 것과 달리 교육을 받거나 책을 통해 습득하기 어렵기 때문에 직접 참여해야 얻을 게 더 많다는 내용이었다.


김재흥 팀장은 오픈소스를 클라우드에 도입할 때 실제로 구축해보고 사례들을 살펴보면서 배우는 게 중요하다고 강조했다. 그는 “오픈소스 생태계는 얼리어답터 정신으로 미리 해보고, 접해서 문제가 되는 걸 찾아내 해결하는 것도 중요하다”라고 말했다. 김영우 프로젝트 매니저도 “오픈소스는 개발자가 배울 수 있는 책이나 교육자료로 나오기까지 시간이 굉장히 오래 걸리며, 나오더라도 책이나 교육자료가 현재 진행되고 있는 오픈소스 프로젝트를 따라잡기는 힘들다”라며 “개발자들은 직접 오픈소스 프로젝트에 참여해 메일링 서비스를 받는 식으로 정보를 꾸준히 습득해야 한다”라고 거들었다. 코드 작업에 직접 기여하지 않더라고, 정보를 습득하고 오픈소스에 대해서 배운다는 점에서 일단 커뮤니티 활동해 참여하는 게 중요하다는 얘기다.


한재선 대표는 “빅데이터와 클라우드를 하겠다며 온 개발자들이 하둡과 오픈소스에 관심이 많은 것은 사실이지만, 실제로 하둡과 NoSQL을 깔아 해봤다고 답한 이들은 거의 없었다”라며 “요즘 아마존웹서비스, 유클라우드, 티클라우드로 서버 마련해서 작업할 수 있는 만큼 적극적으로 참여했으면 한다”라고 말했다.


기능, 라이선스, 커뮤니티


몽고DB, 카산드라, H베이스 같은 오픈소스들이 워낙 많다보니 어떤 기준을 갖고 오픈소스를 도입해야 하는지 기업들이 알쏠달쏭하게 마련이다. 패널토의에서는 오픈소스 도입시 기업이 가장 중요하게 여겨할 할 요소에 대한 설명도 나왔다. 단순히 설치가 쉽다는 이유로 몽고DB와 카산드라를 선택할 것이 아니라 하고자 하는 서비스에 맞춰 설계하는 게 중요하기 때문이다.


패널토의 참가자 모두 직접 오픈소스로 기업 인프라를 구축해 본 경험이 있는 사람이다보니, 현실적인 조언이 이어졌다. 김재흥 팀장은 “오픈소스로 클라우드 컴퓨팅을 구축할 경우 클라우드의 성격을 명확히 할 필요가 있다”라며 “프라이빗으로 구축할지 퍼블릭으로 구축할지 여부에 따라 도입하는 오픈소스가 달라질 수 있는만큼 오픈 소프트웨어 문서를 꼼꼼히 살펴보면 좋다”라고 말했다.



김영우 프로젝트 매니저는 기능, 라이선스, 커뮤니티를 살펴봐야 한다고 강조했다. 오픈소스가 내가 필요로 하는 기능을 담고 있는지, 해당 오픈소스를 쓰기 위한 라이선스 조건이 어떻게 돼 있는지, 도입한 오픈소스에 문제가 있을 때 이를 해결할 수 있는 활발한 논의가 커뮤니티 내 이뤄지고 있는지를 확인하라고 말이다. 특히 그는 “활발하지 않은 커뮤니티의 오픈소스를 도입한다는 건, 시한폭탄을 갖고 들어가는 것”이라며 커뮤니티가 공론화 할 수 있는 장소인지를 반드시 살피라고 당부했다.


안정적이고 인정받은 오픈소스를 도입하라는 충고도 있었다. 전희원 팀장은 “기능, 라이선스, 커뮤니티 모두 중요한 오픈소스를 기업이 도입할 때 고려해야 할 중요한 요소”라며 “기업 인프라에 도입하려면 오픈소스 기본기가 탄탄한지 버전 상태와 버전업 정도를 살펴보는 것도 중요하다”라고 설명했다.


‘데이터 과학’은 예전에도 존재했다


‘데이터 과학’에 대한 언급도 빠지지 않았다. 권정민 넥스알 데이터 분석팀 수석연구원은 데이터 과학이 빅데이터 시대를 맞아 갑자기 등장한 학문이 아니라고 주장했다.


“제가 분석가로 꽤 오래 활동해서 말할 수 있는데, 과거에 분석할 게 없어 놀면서 돈 벌었던 게 아닙니다. 데이터 과학은 데이터 모델링이라고 해서 1997년부터 시작했습니다. 당시 버클리대학은 논문을 발표하면서 데이터를 분석해서 통찰력을 얻는 학문으로 ‘데이터 모델링’을 언급했는데, 이는 데이터 과학과 다르지 않습니다. 데이터에서 통찰력을 얻는 방법과 기술이 달라졌을 뿐 본질은 같습니다.”



권 수석연구원 설명에 따르면 과거에는 데이터를 처리할 때 데이터베이스 기반이나 파일 기반으로 처리해야 했다. 두 처리방법 모두 장단점이 있다. DB 기반은 데이터가 쌓일수록 처리 비용이 많이 들었으며, 피일 기반은 여러 사람이 동시에 원하는 데이터를 찾아 수정하기 힘들다. 권 수석연구원은 “하둡과 R가 등장하면서 데이터 처리와 분석 방법이 쉬워졌고, 데이터 과학이라는 말이 다시 나왔을 뿐”이라고 지적했다.




※ 본 내용은 (주)블로터 앤 미디어(http://www.bloter.net)의 저작권 동의에 의해 공유되고 있습니다.


[원문출처 : http://www.bloter.net/archives/112396]

맨 위로
맨 위로