본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

빅데이터에서 하둡을 써야 하는 5가지 이유

OSS 게시글 작성 시각 2016-06-17 11:09:50

2016년 06월 14일 (화)


ⓒ 아이티투데이, 이병희 기자


김병곤 클라우다인 대표, "가격이 가장 큰 매력"




▲ 김병곤 클라우다인 대표가 한양대 오픈소스SW사업단, 서울산업진흥원 주최의 재직자 교육에서 하둡을 찾는 5가지 이유에 대해 설명했다.

"빅데이터 시장은 특이한 시장이다. 소프트웨어를 팔면 안된다. 서비스를 팔고 플랫폼을 구축해야 하는 시장이다.”

김병곤 클라우다인 대표는 한양대 오픈소스SW사업단의 재직자 교육에서 하둡을 기반으로 한 빅데이터 시장에 대해 설명했다. 김 대표는 “국내 회사들이 소프트웨어를 팔려고 했는데 대부분 성공하지 못했다”면서 “외국 기업의 경우 배포판을 쓸 수 있게 놔두고 서비스를 하면서 플랫폼 사업을 하는 곳이 많다”고 설명했다. 패키지 시스템은 어렵고 솔루션 베이스로 가는 것이 맞는게 우리나라 기업이 그 역량을 갖기가 쉽지 않다는 것이다.

김병곤 대표는 “빅데이터 사업을 하려면 관점을 바꿔야 하고, 분석이나 빅데이터 솔루션을 활용하겠다고 하면 엔지니어를 확보하는 것이 제일 중요하다”고 말했다.

김 대표는 빅데이터를 할 때 하둡을 찾는 이유에 대해 설명했다. 그 첫 번째는 가격이다. 빅데이터를 한다고 했을 때 제일 먼저 큰 데이터를 저장하기 위한 저장소와 CPU의 자원이 필요한데 비용이 많이 들게 마련이다. 예산을 최소화하려다보니 하둡을 찾을 수 밖에 없게 된 것이다. 두 번 째는 하둡은 대용량 파일을 저장할 수 있는 분산 파일 시스템을 제공한다는 것. 애플리케이션/트랜잭션 로그정보가 매우 크기 때문에 이를 보완할 수 있는 장점이다.

세 번째는 멀티 노드로 부하를 분산시켜 처리한다는 점이다. I/O 집중적이면서 CPU도 많이 사용하는 점을 보완한다. 네 번째는 하둡은 장비를 증가시킬수록 성능이 직선모양(linear)에 가깝게 향상된다는 점. 데이터베이스는 하드웨어 추가시 성능향상이 리니어하지 않기 때문이다.

다섯 번째는 하파치 하둡은 무료라는 점이다. 데이터베이스는 소프트웨어와 하드웨어가 비싸기 때문에 이런 점을 보완한다. 물론 하둡 배포판의 경우 유료로 판매를 하지만 인텔 코어 머신과 리눅스는 저렴하기 때문에 전체적으로 비용이 적게 들기 마련이다.

 




※ 본 내용은 (주)아이티투데이 (http://www.ittoday.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ 아이티투데이. 무단전재 및 재배포 금지


[원문출처 : http://www.ittoday.co.kr/news/articleView.html?idxno=70921]

맨 위로
맨 위로