본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2013년 03월 04일 (월)

ⓒ ITWorld, 이대영 | ITWorld


국내 빅 데이터 시장에서의 업체 현황은 10년 전, 수많은 업체들이 해당 시장에 진출하던 CRM의 그것과 거의 유사하다.

초기 애플리케이션 시장이 으례 그렇듯이 시장 성장은 기대치에 미치지 못하고 수요 자체가 매우 적다. 그리고 전문 업체의 출현과 함께 기존 비즈니스를 바탕으로 시장 확장을 꾀하는 IT 업체들이 신규 시장에 진출한다는 것도 다들 예상할 수 있다. 이와 함께 전문가 수는 턱없이 모자르는 것이 당연하다.


뿐만 아니라 이들 업체의 제품 간의 비교 분석으로 옥석을 구분하는 것도 어렵다. 빅 데이터 관련 솔루션의 종류는 일반 데이터 관련 시장만큼 다양하며, 거의가 패키지가 아니라 반 구축형, 반 패키지이기 때문이다.


대부분의 빅 데이터 솔루션 전문업체들은 오픈소스와 웹에서 대규모 비정형 데이터를 저장하고 구성할 수 있는 하둡 분산 파일 시스템(HDFS)을 기반으로 한 상용 제품과 분석 솔루션으로 시장을 개척하고 있다.


사실 상의 표준으로 자리잡고 있는 빅 데이터 플랫폼인 하둡(Hadoop)은 서버 시장의 리눅스보다 더 좋은 상황을 맞이하고 있다. 오픈소스의 대표격인 리눅스는 이미 서버 시장에서 한 축을 맡고 있다. 그간 데이터베이스 시장에서는 관계형 DBMS가 워낙 굳건하게 자리를 잡고 있어 오픈소스 DB는 그리 활개를 펴지 못했지만, 새로운 빅 데이터 시장에서 하둡은 이미 대세로 자리잡은 것이다. 그래서 글로벌 IT업체들을 위시한 수많은 BI(Business Intelligence) 업체들은 경쟁하듯이 하둡 지원 제품을 내놓고 있는 형국이다.


글로벌 BI 업체의 빅 데이터 준비 현황

SAS, SAP, 오라클, 테라데이터, HP, IBM 등의 글로벌 BI 개발업체들은 향상된 데이터 분석 능력을 제공하는 툴을 공급하기 위해 노력해왔다. 기존 BI 업체 대부분은 하둡 플랫폼을 다른 툴을 통해 분석하기 위한 다중-구조적 데이터를 준비하고 옮기는, 주로 거대 데이터 저장 용도로 보고 있다.


SAP는 대형 조직들이 하둡 환경을 SAP의 HANA 인-메모리 데이터베이스와 관련 기술들과 통합할 수 있게 해주는 새로운 빅 데이터 번들을 공개했다. 이 번들 제품은 SAP HANA 플랫폼을 이용해 하둡 환경으로부터 데이터를 읽고 로드한 후, 그 데이터에 SAP의 리포팅, 분석 툴을 이용해 빠른 상호 분석을 수행한다.


SAS는 비슷한 능력의 하이 퍼포먼스 애널리틱 서버(High Performance Analytic Server)를 발표했다. HP는 버티카(Vertica) 인수를 통해 취득한 기술로, 테라데이터는 자체 제품인 애스터-하둡 어댑터(Aster-Hadoop Adaptor)로, IBM은 네티자(Netezza) 툴 세트로, 비슷한 기능을 제공하고 있거나, 곧 제공할 예정이다.


주요 하둡 관련 전문 업체들의 활동도 활발하다. 상업적 하둡 기술의 최대 개발업체인 클라우데라는 하둡 분산 파일 시스템(Hadoop Distributed File System)에 저장된 데이터의 실시간 쿼리 엔진인 클라우데라 임팔라(Cloudera Impala)라는 기술을 출시했다.


클라우데라에 의하면, 임팔라 기술을 통해 기업들은 한 시스템에서 구조적, 비구조적 데이터 배치와 실시간 작업을 할 수 있다.


국내 빅 데이터 업체의 전략 예시

국내 빅데이터 솔루션 업체인 kt 클라우드웨어 또한 빅 데이터 배치 처리와 근 실시간 검색 플랫폼 NDAP을 제시하고 있다.


NDAP은 빅 데이터 분석을 위한 모든 작업(수집/저장/분석/검색/관리 등) 및 실시간 데이터 질의를 처리할 수 있는 소프트웨어 플랫폼으로, ANSI SQL를 기본 언어로 사용해 신규 개발 및 기존 DB나 DW(Data Warehouse)의 마이그레이션(Migration)이 용이하다는 점이 특징이다. 또한 kt 클라우드웨어 측은 빅 데이터 처리 및 향후 데이터 증가에 유연하게 대처할 수 있는 확장형(scale-out) 구조라는 것을 강조하고 있다.


자료. <빅 데이터 기업의 솔루션 및 서비스 추진 현황> NIA 빅데이터 전략연구센터, 2012.06


하둡 지원한다는 BI업체 검증법

BI 업체가 하둡과 완벽하게 통합되는 제품이라고 소개한다면, 그 업체에게 꼼꼼하게 따져봐야 한다는 지적이 일고 있다.


포레스터 애널리스트 보리스 에벨슨은 "정확히 빅 데이터 지원이 무엇을 의미하는지 설명하지 않은 채 하둡이 이슈가 되니까 BI업체들이 빅 데이터를 지원한다고 발표하고 있다"라고 지적했다. 에벨슨은 "IT 관리자가 하둡 통합에 대한 BI업체들의 주장을 그대로 받아들이기 전에 이들 업체들에 구체적인 설명을 요구해야 한다"고 주장했다.


에벨슨은 "하둡은 그리 단순한 기술이 아니다. 데이터 접근, 데이터 통합, DBMS, 시스템 관리, 보고, 분석, 데이터 탐색 등과 같은 하둡 생태계 내에서 특정 틈새 분야에 각각 대응하는 다양한 프로젝트의 집합체"라고 밝혔다.


에벨슨은 "BI 툴이 정말로 하둡과 통합되는지를 확인하려면, 여러 단계의 검증이 필요하다"며, 하둡이 지원된다는 업체들에게 다음과 같은 질문을 던지라고 주문했다.


- BI 툴이 하둡 데이터와 상호작용하기 하기 위해 SQL이나 SQL같은 쿼리 언어를 사용하나?
- H베이스와 카산드라 같은 NoSQL DBMS에 접근할 수 있나?
- 데이터 모델 없이 HDFS 데이터를 탐색할 수 있나?


시장 현황을 파악하면서 대체로 오해하는 상황이 발생하는 것은 솔루션 업체의 매출이나 인력 규모를 보고 제품의 수준을 판단하는 경우다. 글로벌 IT 업체들의 총 인원 수는 당연히 많지만, 관련 분야의 전문가는 사실 전문업체보다 훨씬 적은 규모일 가능성이 높다. 하지만 이 글로벌 업체들은 관련성이 적은 전문가까지 포함시킴으로써 전문가 보유 수를 과장하곤 한다. 본사에서도 이럴진대, 국외 지사인 경우는 이보다 못하진 않을 것이다.


현재 빅 데이터 시장은 글로벌 IT 업체라고 기술력이 탁월하거나 적용 사례가 많은 것도 아니며, 전문업체라고 해서 모든 요구 사항을 다 해결할 수 있는 것도 아니다. 그렇다고 기존 BI 솔루션 업체가 빅 데이터 솔루션을 제대로 소화하지 못한다는 것도 아니다.


빅 데이터는 인력이나 기술, 시장 측면에서도 글로벌 IT 업체나 국내외 빅 데이터 솔루션 전문업체 모두 첫 출발점에서 막 출발한 상황이기 때문이다. 전문업체들은 기업의 모든 역량을 한 분야에 집중하기 때문에 기술 집약도나 인력 숙련도 측면에서 글로벌 IT 업체들을 능가할 수 있다. 글로벌 IT 업체들이 신생 빅 데이터 전문 업체들을 인수하는 이유가 바로 여기에 있다.


가트너, BI 업체의 미래 계획 수립시 고려 사항 제시

가트너는 빅 데이터 시장이 성장을 지속하기 위해서는 BI(Business Intelligence)와 분석(Analytics)의 역할이 확대돼야 하며, BI 책임자들은 갈수록 확대되고 있는 정보 자산을 수용할 수 있어야 한다고 밝혔다.


가트너 리서치 이사 다니엘 유엔은 "기업들은 조직 내/외부의 다양한 소스에서 발생하는 데이터에서 실행 가능한 통찰력을 발견하고 이를 의사 결정에 활용하려는 바람을 가지고 있다”며, “다양한 IT 업체들, 특히 틈새업체들이 앞다투어 시장으로 몰려들고 있어 기업들은 폭넓은 정보 기반을 활용해 보다 안전한 전략적 결정 및 신속한 조직 운영 결정을 내릴 수 있는 능력을 갖게 됐다”고 설명했다.


기업들은 빅 데이터 프로그램이 특히 비구조화된 데이터, 텍스트, 행동 분석과 시간 기반 쿼리(time-based query)의 분석 시 하둡 기반 분석이 제공할 수 있는 강점을 인식하고 있다.


가트너는 기업들이 향후 몇 년간 하둡 기반 DB 제품과 기기들을 시험 사용하는 동안 빅 데이터 애플리케이션 제공업체들은 이보다 한 단계 진보된 맞춤형(purpose-built) 하둡 기반 분석 기능을 출시할 것이라고 예상했다.


이 같은 추세는 현재 클라우드 기반으로 패키지된 애플리케이션에서 가장 두드러지게 나타나며, 앞으로도 계속될 전망이다.


기업의 당면 과제, 빅 데이터 업체 옥석 구별

그렇다면 기업 고객들은 이 업체 가운데 옥석을 어떻게 구별할 수 있을까? 빅 데이터를 도입하려는 기업들은 우선 자사의 빅 데이터의 의미와 효과, 목표를 명확히 해 둘 필요가 있다. 또한 빅 데이터 업체들의 제품 전략과 사례를 면밀히 검토하면서 솔루션 로드맵과 자사의 빅 데이터 방향성과 비교하고 이를 구현하는 전문인력의 수 등을 통해 신중히 판단할 수 밖에 없다.


NIA 빅데이터 전략연구센터는 <빅 데이터 솔루션 업체 현황> 보고서를 통해 기업들이 빅 데이터를 이해하고 업무에 활용하기 위해서는 빅 데이터 서비스 및 솔루션 공급 현황을 파악하는 것이 필요하다고 밝혔다.


이 보고서는 기업뿐만 아니라 공공, 통신, 교육, 교통, 의료 등 여러 분야에서 제기되는 빅 데이터 서비스는 목적과 대상에 맞는 다른 접근법이 필요하기 때문에 다양한 고급분석 기법을 활용해 관계, 패턴, 트렌드, 의미, 선호도, 통계 분석 등 목적에 맞는 분석 결과 도출할 수 있다고 설명했다.


그래서 현재 빅 데이터 관련 업체들이 하둡 생태계에서 어디에 위치해 있는지, 그들의 제품 전략과 향후 로드맵이 중요한 것이다. 현재 국내 빅 데이터 시장에서 활동하는 업계를 총망라한 지도는 없다. 다만 포브스에서 발표한 빅 데이터 업계 지도를 통해 간접적으로 파악할 수 있을 것이다.


자료. <빅 데이터 기업의 솔루션 및 서비스 추진 현황> NIA 빅데이터 전략연구센터, 2012.06 재인용


글로벌 IT 업계의 빅 데이터 추진 현황


EMC

- 데이터 저장부터 관리, 분석까지 빅 데이터와 관한 모든 것을 제공하기 위해 그린플럼, 아이실론 등 빅 데이터 솔루션 업체 및 데이터 관련 다수업체 인수
- 빅 데이터 스토리지 솔루션(아이실론, 아트모스), 콘텐츠 관리 솔루션(다큐멘텀)


2012년 12월 EMC와 VM웨어 양 사는 빅 데이터와 PaaS 클라우드 제품군을 피보털 이니셔티브(Pivotal Initiative)란 별도의 업체로 분사시켜 EMC와 VM웨어에 분산되어 있는 기술과 인력, 프로그램을 모두 흡수해 하나의 체제로 운영한다고 밝혔다.


여기에는 VM웨어의 오픈소스 클라우드 기반 애플리케이션 개발 플랫폼인 클라우드 파운드리 PaaS와 EMC의 빅 데이터 전략인 그린플럼, VM웨어의 v패브릭 미들웨어가 포함된다. v패브릭에는 스프링과 젬파이어(GemFire) 제품군이 포함되어 있는데, 스프링은 오픈소스 자바 개발 프레임워크이고, 젬파이어는 인메모리 데이터 관리 툴이다. VM웨어가 데이터 분석 전문업체인 세타스(Cetas)로부터 인수한 지적재산권 역시 새로운 조직으로 귀속된다.


한국 EMC는 2013년 1월 EMC 벨로시티 파트너 데이 2013를 개최하는 자리에서 클라우드 컴퓨팅, 빅 데이터, 보안을 핵심 전략으로 삼고, 협력 업체의 영업 이익 확대를 위해 교육과 운영 지원 체계를 강화하는 전략을 소개했다. 한국 EMC는 빅 데이터 전문 인력 양성을 위한 산학 협력을 강화하고, 기업의 빅 데이터 전략과 분석을 위한 전문인력 양성을 목표로 교육 프로그램인 데이터 과학 및 빅 데이터 분석 과정을 신설했다.


EMC는 빅 데이터 솔루션인 그린플럼을 통해 데이터 분석 시장에서의 선진 기술을 공유한다는 계획이다. 그린플럼 데이터베이스, 하둡, 코러스 관리 소프트웨어 등을 통합한 통합 빅 데이터 분석 플랫폼인 EMC 그린플럼 유니파이드 애널리틱스 플랫폼(UAP)과 MPP(Massively Parallel Processing) 아키텍처 어플라이언스인 그린플럼 DCA, 하둡 솔루션인 그린플럼 하둡과 그린플럼 MR, 관리 솔루션인 그린플럼 코러스, 분석 컨설팅 서비스인 그린플럼 애널리틱스 랩 등의 제품군을 통해 빅 데이터 시장을 공략하고 있다.


HP

- BI 솔루션 업체 ‘버티카’, 기업용 검색엔진 업체 ‘오토노미’ 인수
- 버티카와 오토노미를 결합해 빅 데이터 분석 시장에 진입
- 기업경영 의사결정, 경영정보 분석 등 경영지원 전략 수립 서비스 제공


HP는 2012년 6월 HP 디스커버 2012 컨퍼런스에서 아파치 하둡을 결합시킨 ▲하둡 레퍼런스 아키텍처 ▲아파치 하둡을 위한 HP 앱 시스템 ▲오토노미 IDOL과 연결된 데이터 처리 플랫폼 ▲빅데이터 전략 워크숍 등의 다양한 솔루션과 서비스를 발표했다.


다양한 솔루션 및 서비스 등을 통해 하둡 클러스터 환경을 최적화시키기 위한 도입 및 설치 단계를 지원한다. 이와 함께 클라우데라나 호튼웍스, MapR과 같은 전문업체와의 협력을 통해 고객 환경에 적합한 플랫폼 구축이 가능토록 한다는 전략이다.


HP는 국내에서도 이와 같은 시장 전략을 펼치고 있다. 한국HP는 SAS코리아, 엔소프와 파트너십을 체결하고 SAS 하이-퍼포먼스 분석 솔루션 내의 인-메모리 분석(In-Memory Analytics) 기술이 적용된 SAS 비주얼 애널리틱스 솔루션과 시스템 구축과 기술 지원 협력업체인 엔소프테크놀러지와 함께 데이터 분석 시장과 금융 컴플라이언스 시장 공략에 나섰다.


또한 한국MS와 이씨마이너와의 협력 관계를 통해 제조 하이테크 산업에 특화된 빅 데이터 플랫폼 시장을 공략하고 있다.


IBM

- 분석용 데이터 저장관리 업체(네티자), 데이터 통합 업체(에센셜), 분석 솔루션 업체(코그너스) 등 비즈니스 분석 관련업체 인수
- 빅 데이터 솔루션 : InfoSphere BigInsight(Hadoop), InfoSphere Streams


EMC와 함께 빅 데이터 시장을 주도하는 IBM은 이 시장의 폭발적인 성장에 따라 하드웨어에서부터 애플리케이션, 서비스에 이르기까지 가장 많은 이익을 창출할 것으로 보인다. IBM은 2012년 10월 IBM IOD(Information on Demand) 2012 행사에서 지난 수년간 강조해왔던 스마터 플래닛을 실현하기 위한 빅 데이터 처리 및 분석 제품군을 소개했다.


한국IBM은 빅 데이터 통합 검색 및 탐색 소프트웨어인 IBM 인포스피어 데이터 익스플로러(InfoSphere Data Explorer)를 국내 시장에 출시했다. 인포스피어 데이터 익스플로러는 IBM이 2012년 5월 비비시모(Vivisimo) 인수를 통해 확보한 통합 검색 및 탐색 역량을 인포스피어 제품군에 통합해 내놓은 제품으로, 데이터 탐색 및 시각화 분야의 혁신적인 기술을 토대로 데이터의 구조화 여부에 관계 없이 손쉽게 데이터에 접근해 유용한 정보를 추출할 수 있게 해준다.


이 제품은 콘텐츠 관리시스템, 고객관계관리(CRM), 공급망관리(SCM), 이메일 시스템, 관계형 데이터베이스 등 광범위한 애플리케이션들의 정형, 비정형 데이터를 신속하게 검색 및 탐색할 수 있으며, 풍부한 분석기능으로 다수의 정보원들을 아우름으로써 단일 정보원에서 파악하기 어려운 거시적인 관점과 통찰력을 제공한다.


특히 전사 빅데이터의 탐색 및 조회를 한 화면에서 지원하는 간편한 인터페이스로 사용자의 부담을 덜어주는 동시에 기업의 경영 의사 결정에 필요한 정보를 신속 정확하게 확보할 수 있게 해 준다.


하둡 기반 빅데이터 분석 솔루션인 IBM 인포스피어 빅인사이트(InfoSphere BigInsights) 제품은 인포스피어 데이터 익스플로러의 데이터 통합 기능으로 무장, 자동으로 데이터를 탐색해 유의미한 주제를 찾아내고, 데이터간의 관계를 보여주며, 데이터의 가치와 데이터 사용의 배경을 확인시켜 줄 수 있게 된다.


IBM은 데이터를 실시간으로 분석하는 소프트웨어인 인포스피어 스트림즈와 빅 데이터 처리 및 분석을 위한 DB 어플라이언스 솔루션인 퓨어데이터 시스템즈와 함께 빅 데이터 시장을 공략하고 있다.


오라클

- 하이페리온 인수로 분석 기술 확보
- 오라클 빅 데이터 어플라이언스 제품 출시


2011년 10월 오라클은 소프트웨어와 하드웨어를 묶은 오픈소스 하둡과 R 프레임워크를 위한 지원하는빅데이터 어플라이언스를 출시했다. 이를 바탕으로 2013년 1월 오라클 빅 데이터 어플라이언스 X3-2(Oracle Big Data Appliance)와 오라클 빅데이터 커넥터(Oracle Big Data Connectors)를 출시했다.


빅 데이터 어플라이언스 X3-2는 빅 데이터 어플라이언스를 위한 새로운 오라클 엔터프라이즈 매니저(Oracle Enterprise Manager) 플러그인은 물론, 인텔의 새로운 프로세서, 클라우데라의 아파치 하둡 배포판(Cloudera's Distribution Including Apache Hadoop, CDH)과 함께 업그레이드된 비용 효율적인 소프트웨어와 하드웨어 통합 시스템이다.


또한, 오라클 빅 데이터 커넥터는 오라클 데이터베이스에서 하둡으로 더욱 향상된 SQL 엑세스를 제공하며, R에서 하둡으로 더욱 투명한 엑세스가 가능하도록 향상됐다. 이는 오라클이 탑재한 소프트웨어 스위트로 아파치 하둡과 오라클 데이터베이스, 오라클 데이터 인티그레이터(Oracle Data Integrator) 및 오라클 R 배포판을 통합한다.


오라클 엑사데이타 데이터베이스 머신(Oracle Exadata Da4tabase Machine) 및 오라클 엑사리틱스(Oracle Exalytics)와 함께 사용됐을 때, 빅 데이터 어플라이언스와 오라클 빅 데이터 커넥터는 빅데이터를 수집, 체계화 및 분석하기 위한 풀세트의 엔지니어드 시스템을 지원하며, 이번 최신 제품은 더욱 강력한 프로세싱 파워, 메모리 용량, 향상된 통합 및 관리 기능을 지원한다.


SAS

- 고급 분석(Advanced Analytics)을 위한 ‘HPA(High Performance Analytics) 기반의 SEMMA 방법론 제시
- IT+분석+비즈니스 통합 플랫폼 구현(SAS 빅데이터 분석 플랫폼 Solution MAP)


시장 분석 전문 기관인 포레스터 리서치가 발표한 보고서(Big Data Predictive Analytics Solutions, Q1 2013)에서 SAS는 빅데이터 예측 분석 솔루션 부문 1위로 선정됐다.


이 보고서는 예측 분석이 비즈니스 성과를 획기적으로 개선할 수 있음을 언급하면서, 특히 빅 데이터 분석의 중요성을 강조했다. 포레스터에 따르면, SAS는 제품 제공 범위(offering), 전략, 시장 인지도 등 세 가지 평가 영역에서 다른 업체들을 제치고 모두 최고점을 획득했다. 그 가운데 제품 배치(Deployment), 파트너십, 제품 로드맵, 아키텍처 등 5가지 항목에서는 만점을 받은 것으로 나타났다.
SAS의 주력 빅 데이터 제품군은 SAS 하이퍼포먼스 애널리틱스 서버(High-Performance Analytics Server), SAS 비주얼 애널리틱스(Visual Analytics), SAS 데이터플럭스 이벤트 스트림 프로세싱 엔진(DataFlux Event Stream Processing Engine) 등 이다.


SAS코리아는 2012년 11월, 끊임없이 유입되는 대량의 스트리밍 데이터를 즉각적으로 분석, 실시간 의사결정을 지원하는 SAS 데이터플럭스 ESP(SAS DataFlux Event Stream Processing Engine)을 국내 출시했다.


SAS 데이터플럭스 ESP 엔진은 진행 상태에 있는 대규모의 이벤트를 분석하는 솔루션으로, 중요 데이터 관리 및 분석 애플리케이션에 효율적인 복합 이벤트 프로세싱(Complex Event Processing, CEP) 기술을 채용했다. 이 솔루션은 정형, 비정형 데이터들에 대한 관계분석, 절차적 분석 그리고 패턴 매칭(Pattern-matching) 분석기술을 포함하고 있으며 첨단 설계 기술을 적용한 임베디드 서비스 형태로 유연하게 배치할 수 있다는 것이 특징이다.


테라데이타

- 데이터웨어하우징 및 비즈니스 인텔리전스(BI) 전문 업체
- 비정형 데이터의 고급분석•관리 솔루션 업체 인수(애스터데이터)
- 애스터 맵리듀스 플랫폼 제시


테라데이타는 2012년 10월 테라데이타 애스터 빅 애널리틱스 어플라이언스를 출시했다. 테라데이타 측은 이 제품이 각각 다른 장비를 하나의 박스에 담는 수준이 아니라 노드 단위에서부터 단일한 방식으로 데이터 분석을 수행한다는 것이 특징이라고 밝혔다.


테라데이타는 하둡 플랫폼에 정면 도전장을 내민 대표적인 업체다. 하둡은 전문 인력이 필요하기 때문에 비용이 많이 들어 TCO 측면에서 본다면, 하둡 전문 지식없이 빅 데이터 분석이 가능한 애스터 플랫폼이 낫다고 주장했다.


한국테라데이타는 국내 빅 데이터 선두업체로 나서기 위해 2011년 인수한 애스터데이터 기술을 활용한다. 하둡 분석처리기술인 맵리듀스 도입을 지원하는 애스터 맵리듀스 어플라이언스, 테라데이타와 애스터데이터 시스템간 고속 데이터 전송을 위한 애스터 어댑터를 제공한다.


더불어 하이브리드 방식의 컬럼과 행기반 데이터베이스를 표방하는 테라데이타DB 14, 테라데이타 유니티, 애스터 맵리듀스 어플라이언스, DW어플라이언스2690 등을 출시했다. 맵리듀스를 통해 일반 사용자들이 빅데이터를 SQL 형태로 쉽게 다룰 수 있도록 돕는 애스터DB 5.0도 출시했다.


한국테라데이타는 금융, 유통, 통신, 제조, 의료, 운송, 테크 등 각 업종별 솔루션을 제시하면서 이 시장 공략에 나섰다. 또한 국내 SI 업체들과 SAS, 마이크로스트레티지(MSTR), 인포매티카, 넷앱 등 글로벌 협력업체와의 관계를 다지고 정기 교육, 공동 프로모션을 진행하고 있다.


한국 테라데이타는 2013년 1월, 기존의 트랜잭션 데이터와 상세한 상호작용 데이터를 활용해 고객에 대한 360도 뷰를 제공하는 테라데이타 CSP 차세대 분석 프레임워크(Teradata CSP Next Generation Analytics Framework)를 발표했다.


테라데이타 CSP 차세대 분석 프레임워크는 모든 데이터 상호작용에 가시성을 제공해 통신서비스 제공업체(CSP)들이 고객 행동 및 제품 선호도에 대한 빅 데이터 분석 통찰력을 얻을 수 있도록 해준다. 이 프레임워크에는 통신서비스 제공업체(CSP)들의 서비스, 네트워크, 기기, 위치, 소셜 네트워크 디지털 마케팅, 가입자와의 전자상거래 상호작용에 대한 상세 정보가 포함돼 있다.


국내 IT 업체의 빅 데이터 사업 추진 현황 및 전략


kt클라우드웨어

초대형 빅 데이터 구축 사례를 통해 시장 공략에 나선 kt클라우드웨어는 차세대 정보통신 기술 사업을 위한 핵심 기술 개발과 기술지원 업체인 kt 이노츠, 국산 클라우드 플랫폼 업체인 아헴스, 대용량 분석 저장 처리기술업체인 넥스알을 인수한 국내 빅 데이터 전문 소프트웨어 업체다.


kt클라우드웨어의 주력 제품인 NDAP은 글로벌 빅 데이터 표준기술로 부상한 하둡의 주요 핵심 기능들을 표준화해 엔터프라이즈 환경에 최적화된 플랫폼을 제공, 하둡에 대한 전문지식이 없이도 하둡을 도입할 수 있다. NDAP을 도입함으로써 기존 RDBMS 인프라 성능 및 속도를 개선할 수 있다. 또한, 설치, 사용자 교육, 기술 지원에 이르기까지 빅 데이터에 대한 모든 서비스를 제공해 빅 데이터 도입 시에 시행 착오를 최소화 할 수 있다는 큰 강점을 가지고 있다.


NDAP은 기존 시스템과 상호 운영이 가능하다. ANSI SQL 기반으로 쉽게 데이터처리가 가능하며 기존 RDBMS와의 유연한 연동성을 제공하여, 기존 시스템에 애드온으로도 사용할 수 있고, 단독으로도 사용할 수 있다.


차세대 빅 데이터 플랫폼(NexR Data Analysis Platform, NDAP) : 정형데이터, 비정형데이터, 반정형데이터 등 데이터 형태와 관계없이 모든 데이터의 수집, 처리, 저장, 분석 등 빅데이터와 관련한 모든 엔드 투 엔드 서비스를 제공하는 플랫폼이다.


빅 데이터 분석 솔루션(RHive) : 전세계적으로 가장 널리 사용되는 분석도구인 R과 검증된 대용량 분산 DW시스템인 Hive를 결합하여 kt클라우드웨어에서 개발한 빅데이터 분석 솔루션이다. 기존의 분석 솔루션이 갖고 있던 한계를 넘어 분산병렬처리 기반으로 대용량 데이터를 고급분석이 가능하게 한다는 큰 장점을 갖고 있다.


KT CDR 시스템 : kt클라우드웨어는 국내 최초 빅 데이터 구축 사례를 보유하고 있다. 통신기술의 발달, 스마트폰 보급 확산 등으로 2G, 3G, WIFI, LTE가 도입됨에 따라, KT 통화상세기록(CDR: Call Data Records)의 양이 급증하면서 데이터처리 및 유지보수 비용이 증가하고. 데이터를 추출하고 처리할 때마다 병목현상이 발생하게 되는 이슈가 발생했다.


이 문제에 대한 해결로 하이브리드 형태로 NDAP을 도입하였다. NDAP과 데이터양이 큰 원시 데이터와 계산량이 많이 걸리는 배치 작업은 NDAP에서 수용하고, 마트 데이터와 같이 작고 중요한 데이터와 BI 도구 연동 작업은 데이터베이스에서 처리하도록 했다. 이를 통해 기존 보다 평균 5~10배 성능향상, 5년 TCO관점에서 전통적 하이엔드 서버/스토리지 기반 DW로 구성했을 때와 비교했을 때 최소 567억 원의 비용 절감 효과가 있었다


KT클라우드 로그분석시스템 : KT 유클라우드는 국내 최대 규모의 상용 퍼블릭 클라우드 서비스다. 클라우드 서비스는 가상화를 기반에 두고 있는 만큼 서비스 장애를 최소화하고 가용성을 극대화 하는 것이 매우 중요했다.


이에 KT는 유클라우드 서비스에서 발생하는 로그를 NDAP에 수집하고 RHive로 분석해 클라우드 운영의 품질 개선과 고객 만족도를 극화대할 수 있는 분석 시스템을 개발했다. 이를 통해 서비스 가용성 35% 향상, 장애 대응 시간 50% 단축을 할 수 있게 되었다. 또한 고비용의 분석 인프라와 고가의 서버비용을 절약함으로써 기존 시스템 대비 60%의 비용을 절감하였다고 밝혔다.


그루터
빅 데이터 관련 플랫폼, 기술, 솔루션 전문업체인 그루터는 빅 데이터 관련해 많이 거론되는 대표적인 전문 업체 가운데 하나다.


그루터의 빅 데이터 비전은 데이터 중심 기업(Data Centric Company)으로, 데이터 수집, 분석, 서비스 등 일련의 데이터 프로세스의 전 과정을 경험하고 공유하며 체화해 전문 기술력을 보유한다는 것이다. 향후 솔루션 중심의 기술 안정화, 서비스를 통한 운영 안정화, 그리고 꾸준한 인력 양성을 통해 글로벌 경쟁력을 유지할 전략이다.


이 업체가 주력하는 시장은 빅 데이터 플랫폼 구축 및 컨설팅, 빅 데이터 분석 및 데이터 제공, 빅 데이터 분석 플랫폼 제공 등의 기술과 서비스 등이다.


- 빅 데이터 플랫폼 구축 및 컨설팅 서비스(Big Data Platform Providing & Consulting Service).
- 빅 데이터 분석 및 데이터 제공 서비스(Big Data Analysis & Data Providing Service)
- 빅 데이터 분석 플랫폼 제공 서비스(Big Data Ad-hoc Analysis Platform Service)


그루터는 개별 기업의 특정 목적에 따라 원하는 분석을 자유롭고 효과적으로 수행할 수 있는 빅 데이터 분석 플랫폼인 BAAS(BigData Analysis & Application System)을 제공한다. 이 제품은 대용량 데이터 수집, 저장, 실시간 분석 및 일괄 분석 등 분석용 데이터의 전체 라이프 사이클을 관리하는 플랫폼이다.editor@itworld.co.kr


그루터 빅 데이터 플랫폼의 기본적인 소프트웨어 스택



다음소프트

SNS 정보 기반 여론 진단 서비스, 소셜미디어 트위터, 블로그 트렌드 분석을 내세운 다음소프트는 소셜 미디어 상의 데이터에서 의미 있는 정보를 찾고, 조직화함으로써 정보 간의 관계나 패턴, 트렌드 등을 분석하는 서비스를 제공한다.


기업명 빅 데이터 추진 현황
kt클라우드웨어 하둡 전문인력, 축적된 경험 및 전문기술을 바탕으로 시스템 구성부터 통합까지 엔터프라이즈 환경에 최적화된 완성된 형태의 빅 데이터end-to-end 서비스를 제공하는 기업
빅 데이터의 수집, 처리, 저장, 분석 등 빅 데이터와 관련된 모든 엔드 투 엔드 서비스를 제공하는 플랫폼(NexR Data Analysis Platform, NDAP), 빅 데이터 고급 분석 솔루션(RHive)
그루터 빅 데이터 관련 플랫폼, 기술, 솔루션 전문기업
빅 데이터 플랫폼 구축 및 컨설팅 서비스, 빅 데이터 분석 및 데이터 제공 서비스, 빅 데이터 분석 플랫폼 제공 서비스 구축
다음 소프트 SNS 정보 기반 여론 진단 서비스, 소셜미디어 트위터, 블로그 트렌드 분석 소셜미디어 상의 데이터들에서 의미 있는 정보를 찾고, 조직화함으로써 정보 간의 관계나 패턴, 트렌드 등을 분석하는 서비스 제공
사이람 소셜 네트워크 분석 소프트웨어 넷마이너(NetMiner) 개발: 대규모 소셜 네트워크 및 데이터 간의 관계를 계량적으로 분석해 패턴을 파악하고 시각화하는 기능을 제공
소셜 네트워크 분석 응용솔루션 및 컨설팅 제공
솔트룩스 비정형 빅 데이터 분석 및 시맨틱 기술 전문기업
비정형 빅 데이터 분석 플랫폼(truestory), 클라우드 기반 시맨틱 검색 플랫폼(IN2), 시맨틱 기반 빅 데이터 추론 플랫폼(STORM), 빅 데이터 분석 서비스 플랫폼(O2) 서비스
센솔로지 텍스트 의미 이해 전문 기업
소셜 분석 솔루션(오피니언 버디), 여론분석 서비스(평닷컴) 제공
아크원소프트 하둡 기반의 솔루션 개발 및 공급 전문 기업
데이터 솔루션(Easy-Up) 및SI구축과 아웃소싱 서비스 제공
야인소프트 인메모리 기술 기반의 데이터 분석/처리 전문 기업
BI솔루션(OctagonTM EnterpriseBI Server) 구축
SK텔레콤 소셜 모니터링/분석 솔루션 스마트 인사이트(Smart Insight) 제공
독자적NLP기반의 텍스트 마이닝, 네트워크 분석 지원
엔에프랩 콘텐츠 딜리버리, 클라우드 분야의 빅 데이터 솔루션 전문기업
BI/BA 빅 데이터 통합플랫폼(Peloton) 제공
위세아이텍 BI/데이터관리/데이터 품질관리/CRM분야 솔루션 전문 기업
마케팅솔루션(Campaign), 빅 데이터 저장/분석 플랫폼(Cloud BI), 데이터 공유/활용 오픈플랫폼(Smart BI), 고객 프로파일링 솔루션(Social Analytics) 제공
이씨마이너 빅 데이터 분석 솔루션 및 컨설팅, 시스템 구축 전문 기업
분석 솔루션(ECMiner), 모니터링 솔루션(IMSTM), 룰/연관분석 솔루션(Rule), 이미지 마이닝 솔루션(SIS) 기반의 패키지 서비스 제공
이투온 빅 데이터 분석 솔루션 및 플랫폼 전문 기업
분석 솔루션/서비스(SNSpider), 빅 데이터 분석 플랫폼(UNINAN) 제공
카디날정보기술 컨설팅, 스토리지, 데이터 분석, 시스템 운영관리 전문 기업
스토리지 분야(Monad Storage), 분석 분야(Monad Integration), 시스템 운영·관리 분야(Monad Management)의 솔루션 제공
코난테크놀로지 검색 소프트웨어 개발 및 제공 전문기업
데이터 수집, 검색, 분석기술 기반의 소셜 모니터링/분석 서비스(pulse-K) 제공
클루닉스 클라우드/슈퍼 컴퓨팅 솔루션 개발/제공 전문 기업
하둡 시스템 및 작업관리(Gridcenter Hadoop), 저장 및 처리(Teragon-Hadoop), 분석 클라우드 구축(RNTier) 솔루션 제공
투이컨설팅 컨설팅 서비스 제공 전문 기업, 데이터 과학자 교육훈련 지원.
빅 데이터 환경의 전략 수립 및 프로세스 최적화 컨설팅 서비스(데이터과학 컨설팅 서비스) 제공

자료. 국내 IT업체의 빅 데이터 사업 추진 현황. NIA에서 발췌




※ 본 내용은 한국IDG(주)(http://www.itworld.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒITWORLD. 무단전재 및 재배포 금지


[원문출처 : http://www.itworld.co.kr/news/80580]

맨 위로
맨 위로