2014
마이크로소프트웨어

글: 유재석 기자 yoojs@imaso.co.kr / 2014년 4월호


<FEATURED STORY>

타조, 변방을 넘어 초원을 향해 달리다(3)

‘타조’ 이름의 탄생과 그루터와의 만남

<편집자 주 : 타조(Tajo)는 SQL-온-하둡 계열의 오픈소스 빅데이터 웨어하우스 솔루션이다. 국내 개발자가 최초 발의해 2013년 3월 아파치 재단의 인큐베이팅 프로젝트로 선정됐다. 지난 11월 버전 0.2가 공개된 타조는 섣불리 성패를 예단할 수 없는 현재진행형 프로젝트지만, 인텔과 링크드인, 호튼웍스의 개발자들이 컨트리뷰터로 참여할 정도로 그 가능성을 인정받고 있다. 마이크로소프트웨어는 2008년, 타조가 알 속에서 꿈틀대던 시절로 거슬러 올라가 타조 프로젝트의 진행 과정을 추적하기로 했다. 빅데이터 기술과 글로벌 오픈소스 생태계에서 아직 변방에 머무르고 있는 국내 환경에 타조 프로젝트의 좌충우돌 경험담이 새로운 변화의 전조가 되기를 기대한다.>



담당 교수가 학생들을 한 자리에 모은 이유는 최현식 박사와 손지훈 연구원의 제안으로 시작된 새로운 시스템의 이름을 결정하기 위해서였다. 원래 네트워크 트래픽 분석용 도메인으로 설계됐으나 범용 처리 엔진으로의 가능성도 보이게 되자 하둡 생태계의 관습대로 동물 이름을 이용해 짓기로 했다.


이날 연구실에는 교수를 포함해 모두 10여 명이 모였다. 생각나는 동물 이름을 무조건 하나씩 제시하는 방식으로 투표가 진행됐다. 당연히 최 박사가 ‘타조’라는 이름을 붙였을 것이라고 생각했는데……, 그는 ‘타이거’를 말했단다. 다양한 동물의 이름이 쏟아졌다.


투표를 거쳐 가장 많은 표를 얻은 이름이 ‘타조’였다. 이는 담당 교수가 제시한 이름이었다.


“객관적으로 타조라는 이름이 어감도 좋고, 검색도 잘 되기 때문에 모두가 공감할 수 있었습니다”


최현식 박사와 손지훈 연구원은 타조 개발의 많은 부분을 전담했다. 개발 과정에서 쉬운 건 없었다. 실제 논문들은 주로 세부적인 특정 문제에 초점을 맞추기 때문에 다루는 문제의 영역이 상당히 좁았다. 논문들이나 교과서가 다루지 않는 부분들의 비중이 상당했기 때문에 그 부분들을 메꾸는 작업이 매우 필요했는데 쉽지 않은 작업이었다. 전체 그림을 그리지 못한 상황에서 개발해야 하는 것이 가장 어려웠다.


고등학교 1학년 때 너무 어렵게 느껴진 수학 문제를 2학년 때 다시 풀어보니 그다지 어렵지도 않았던 기억은 누구에게나 있을 것이다. 최 박사가 타조를 만드는 과정도 이와 크게 다르지 않았다.


“지금 처음부터 다시 짜라고 하면 쉽게 할 수 있는 코드들인데, 그때는 지식도 부족하고 시야도 좁았기 때문에 더 힘들었던 것 같아요.”


140207 tajo3_1
최현식 박사 타조 개발 통계(2011년 12월 4일부터 2014년 1월 26일까지), 출처 : 깃허브

최 박사는 2년이라는 세월을 중점적으로 타조에 쏟아부었다. 연구는 재미있었다. 특히 한 분야를 깊게 파서 알아가는 과정이 그랬다. 하지만 그가 가장 두려워한 것은 시간을 투자해 만든 기술이 사장될 수도 있다는 것이었다.


2012년이 왔다. 그는 그해 ICDE 학회에 논문을 제출할 계획이었다. ICDE는 CS 분야의 학회에서는 최고로 대우를 받고 있다. 특히 그는 타조에 대한 반응이 궁금했다.


논문은 예정대로 그해 8월에 제출됐고 10월에 결과가 나왔다. 합격이었다. 하지만 최현식 박사는 이에 만족하지 못했다. 논문 통과 여부도 중요했지만, 단지 논문만을 위해서 2년을 투자한 것은 아니었기 때문이다. 이때 나온 타조 역시 프로토타입일 뿐. 널리 쓰이는 오픈소스가 되기 위해서는 넘어야 할 산들이 많이 남아 있었다.


학계가 실제 기술보다 몇 년 빠르다는 말처럼 그때 당시에는 국내에서 빅데이터와 관련된 시스템을 처리하는 업체가 많지 않았다. 게다가 박사 과정도 마치지 않은 학생이 만든 시스템을 어떤 기업이 쓰려고 한단 말인가.


이러한 상황에서 마침 최 박사의 기술이 필요한 곳이 있었다. 당시 하둡 관련 기술과 노하우로 비즈니스를 하고 있던 벤처 회사 그루터는 글로벌 경쟁력을 가질만한 수준의 데이터 처리를 위한 코어기술을 고민하고 있던 터였다. 하둡 관련 오픈소스 솔루션을 관리하는 클라우몬(Cloumon)이나 하둡 에코시스템을 보완하는 쿠바(qoobah) 플랫폼을 갖고 있었지만 이는 기존의 코어 솔루션들을 잘 다루는 기술일 뿐이기 때문이다.


한쪽은 타조의 전파를, 다른 한쪽은 독자적인 코어 솔루션을 원했다. 그렇다면 둘이 만나면 될 것 아닌가.


그런데 그 일이 실제로 벌어졌다.


140207 tajo3_2
플랫폼데이 2012 포스터

2012년 11월 15일, 서울 강남구 논현동 건설회관 2층에서는 플랫폼데이 행사가 열리고 있었다. 플랫폼데이는 하둡 관련 분야에 종사하는 사람들이라면 누구나 참석하는 국내 하둡 유저 그룹 행사로, 지난 2007년부터 매년 열리고 있다.


최 박사는 예전부터 그루터의 김형준 수석과 트위터를 통해 빅데이터 처리 기술 지식을 공유해왔다. 마침 모두가 만나는 날에 실제로 얼굴을 볼 기회가 생긴 것이다. 두 사람은 이날 인사를 나누고 간단히 이야기하고는 곧바로 헤어졌다.


비록 짧은 시간이었지만, 최현식 박사와 타조가 그루터와 만나 훗날 아파치 재단의 인큐베이팅 프로젝트로 성장하는 여정의 출발점이었다.



/필/자/소/개/

유재석 기자

무미건조해 보이는 숫자들 속에서 '가치'를 발굴합니다.
소셜커머스, 오픈마켓 등 데이터로 가치를 만드는 곳이라면 어디든 찾아갑니다.
yoojs@imaso.co.kr www.facebook.com/YuJaeSuk medium.com/@yoojs8512



※ 본 내용은 (주)마소인터렉티브(http://www.imaso.co.kr/)의 저작권 동의에 의해 공유되고 있습니다.
    Copyright ⓒ Maso Interactive Corp. 무단전재 및 재배포 금지

    [원문출처 : http://news.imaso.co.kr/23211]

맨 위로
맨 위로