본문 바로가기

2012
마이크로소프트웨어

글: 신종호 | jonghoshin9@gmail.com / 2012년 8월호


<COVER STORY>

지금은 빅데이터 시대

빅데이터의 본질과 활용 방안

우리는 소위 빅데이터(Big Data)라는 새로운 IT 조류에 진입하는 시대에 살고 있다. 지난 시대와 달리 이 시대에는 우리 개개인이 주체가 되어 데이터를 생산, 소비한다. 소셜 미디어에 자신의 일과를 포스팅해 친구들과 공유하고 모바일 스마트폰 앱을 사용해 클라우드에 사진을 올리며 인터넷이 연결된 자동차에서 이메일을 체크하고 보낸다. 이러한 빅데이터를 활용하면 일련의 활동들을 종합적으로 분석해 패턴에 근거한 미래를 예측할 수 있다. 이 글에서는 빅데이터 시대를 살아가면서 실생활과 비즈니스에 빅데이터를 어떻게 활용하는지 고민해보고, 어떠한 활용 측면이 핵심이며 본질적인 면은 무엇인지를 살펴본다.



2012년을 살아가는 이들은 이전의 어느 때보다 다양하고 방대한 정보 속에서 살고 있다. 바야흐로 빅데이터의 시대다. 어제 들렀던 맛집에 대한 시시콜콜한 후기를 블로그에 작성하고 온라인상에서 친구들과 실시간으로 자신의 위치, 경험, 사진을 포스팅하며 온라인 쇼핑 사이트에서 제품을 구입한 후 후기를 남기고 포털 카페에 가입해 자유 게시판에 하루 일과 중 재밌었던 에피소드를 올린다. 

엔터프라이즈 측면에서는 기업 마케팅을 위한 사진, 비디오 광고가 TV라는 보편화된 기기를 통해 전달되는 것을 넘어서 스마트폰, 태블릿PC 등과 같은 수많은 동기, 비동기식 기기들에 실시간으로 전파된다. 또한 기업 임직원들이 매일 생산하는 사내 업무 관련 정보는 컴퓨터, 데이터센터, 모바일 기기를 통해 차곡차곡 쌓이고 있다. 모바일 스타벅스 앱을 통해 커피를 구매하면 구매한 장소, 시간이 자동으로 로깅되고 앱을 통한 별점, 후기 등은 사용자들이 선택적으로 로깅한다.



< 그림 1> 전 세계를 데이터로 형상화한 영화 '매트릭스'의 한 장면


이와 같이 모바일, 웹 3.0, 클라우드, 검색, 가상화 등의 최근 테크놀러지들은 우리들에게 진정한 정보화 시대를 살아가게끔 하는 미디어를 제공하며 개개인이 상상할 수 없을 정도의 데이터를 기하급수적 속도로 생산, 축적, 활용할 수 있게끔 해준다. 영화 ‘매트릭스’가 그려내었던 일상과 사물의 토털 데이터화는 단지 가까운 미래에는 공상만으로 끝나지 않을 것 같다. 이렇게 기하급수적으로 증가하는 빅데이터는 내/외부의 정형/비정형 구분이 없는 데이터로 분류 및 분석돼 트렌드, 통계, 액션 등을 취할 수 있는 가치 있는 정보로 확립된다.


2012년, 빅데이터를 말하다
최근 HP 랩에서 트위터의 데이터를 분석해 영화의 흥행여부를 예측할 수 있다는 논문이 발표됐다. 120만 명의 트위터 사용자들의 300만 개에 가까운 트윗을 분석, 3개월간 발표된 24개의 영화들을 예측했다. 데이터의 분석을 통한 예측들 중에 특히 새 영화가 개봉되는 첫 주의 성공은 영화의 개봉 전 트위팅의 비율에 연관성이 있다는 예측은 여러모로 우리의 실 생활에 적용될 수 있는 중요한 결과다. 

예를 들어 영화 개봉 전에 트윗 내용을 분석해 영화 제작사에 대한 주식투자 여부를 결정할 수 있을 것이다. 이는 빅데이터 분석의 핵심적이고도 간단한 결론이 가져다주는 파급력을 여실히 보여준다. 빅데이터 활용은 이타적 디바이스들 간의 통합에 의한 실시간 데이터 생산에도 적용된다. 올해 3월에 나온 주피터 리서치(Jupiter Research)의 보고서에 의하면 스마트폰과 자동차의 통합이 활발히 진행 중이며 2016년 무렵에는 9,000만 대 정도의 자동차가 스마트폰과 통합돼 이메일, 소셜 네트워킹에 의한 실시간 데이터를 생산할 것으로 예상되고 있다.

2012년 IT 분야에서의 화두는 빅데이터다. 그렇다면 빅데이터는 무엇이고 구체적인 모습은 어떤 것일까? 더 나아가 이는 어떻게 활용돼 삶의 질을 향상시킬 수 있을까? 먼저 빅데이터의 정확한 정의가 필요하다. 위키피디아에 의하면, 빅데이터란 데이터 크기가 엄청나고 복잡해 현존하는 데이터 매니지먼트 툴로서 다룰 수 없는 것을 말한다. 이는 정형, 비정형 데이터를 아우른다. 의외로 간단히 추상적으로 정의된다. 

혹자는 인터넷에 한정해 빅데이터를 이야기하기도 한다. 즉, 데이터웨어하우스가 웹을 포함하는 형태로 발전된 것을 말한다. 한편 빅데이터의 생산 미디어는 유비쿼터스 모바일 기기 및 센서, 리모트 센싱 디바이스, 소프트웨어 로그, 카메라, 마이크로폰, 주파수를 인식하는 기기들, 무선 센서 네트워크를 포함한다(위키피디아, 2012). 이렇게 우리 생활 깊숙이 파고드는 빅데이터 기술들은 단지 데이터의 수집이 아닌 데이터 분석/인사이트(insight)의 시기적절한 제공, 그리고 이의 발전된 인텔리전스가 가미된 고급정보를 제공한다.



< 그림 2> 트위터의 데이터를 통해 형상화한 빅데이터(출처 : servicesangle)


<그림 2>는 트위터의 데이터를 통해 형상화된 빅데이터의 가늠할 수 없을 정도의 복잡성을 표현하고 있지만, 한편으로는 거미줄처럼 연결됐음에도 정보 흐름이 한눈에 보이는 예를 보여준다. 정보의 흐름이 집중되는 곳은 그 강도에 따라 짙고 굵은 선들로 형상화된다. 결국 빅데이터의 분석을 통해 얻게 되는 유효하고 중요한 내용은 이러한 정보의 중첩과 쏠림, 패턴에 근거함을 알 수 있다. 빅데이터의 분석 및 결과는 직관적 예측 및 분석을 지지하는 수단이 되며 단계적 또는 전방위적 수치화를 통한 지원 방법이 된다.

가트너의 테크놀러지 ‘하이프 사이클’ 다섯 단계에 따르면 현재의 빅데이터를 다루는 기술은 ‘기대치의 피크(peak of inflated expectations)’에 해당한다. 모든 이들이 빅데이터를 이야기한다는 것이다. 가트너는 2015년까지 포준지에 근거한 전 세계 500대 기업의 85%가 빅데이터를 활용해 어떻게 비즈니스에서 우위를 점할지에 대한 전략이 부족하다고 지적한다.  

그러나 이러한 빅데이터란 개념은 새로운 것이 아니다. 이미 무어의 법칙(Moor’s Law)에 의해 트랜지스터의 수가 18개월마다 2배로 늘어남으로 인해 이미 예견되고 회자돼 왔던 개념이다. 무어의 법칙이 하드웨어적 정보 처리의 발전 기준을 제시했다면 빅데이터는 소프트웨어적 정보 처리의 가능 수준을 정의한다. 빅데이터 분석을 위한 테크놀러지가 발전함에 따라 인메모리 데이터베이스(In-memory Database), 확장 가능 소프트웨어 아키텍처, 하둡 (Hadoop), 맵리듀스(MapReduce), 카산드라(Cassandra) 등과 같은 오픈소스 테크놀러지들이 생겨나게 됐다.


하이프 사이클(Hype Cycle)
1995년부터 정보 테크놀러지 전문업체 가트너에 의해 제창된 개념으로서 새로운 테크놀러지의 특성을 시간에 따라 변이되는 다섯 가지 단계로 표현한 것이다. 이는 전 세계적으로 널리 알려져서 현재 새로운 테크놀러지가 등장한 경우 그 새로운 테크놀러지의 전반적인 예측방향을 논할 때 주로 참조되고 있으며, 업계 표준의 테크놀러지에 대한 시간대적 특성 단계 표현 툴이다.



< 그림 3> 하이프 사이클과 테크놀러지 발전 5단계(출처 : 가트너)


다섯 가지 대표적인 단계는 <그림 2>와 같이 촉발된 테크놀러지(Technology Trigger), 기대치의 피크(Peak of Inflated Expectation), 각성의 골(Trough of Disillusionment), 완만한 개화(Slope of Enlightenment), 그리고 안정적 생산성(Plateau of Productivity)으로 구성된다. 

‘촉발된 테크놀러지’ 단계에서는 새로운 테크놀러지의 등장 또는 테크놀러지에 대한 관심의 촉발을 나타내며 ‘기대치의 피크’ 단계에서는 과잉 또는 거품적이면서 비현실적인 기대에 대한 대중적 관심의 폭발을 보여준다. ‘각성의 골’ 단계에서는 기대치에 못 미치는 테크놀러지의 거품적 논란이 꺼지는 것을 보여주며, 네 번째 단계인 ‘완만한 개화’에서는 비록 언론과 대중적 테크놀러지 인기가 식었을지라도 거품 논란이 있었던 테크놀러지를 지속적으로 적용 및 발전, 비즈니스화 하는 업체들이 테크놀러지 적용을 통해 이득을 얻는 단계를 나타낸다. 마지막으로 ‘안정적 생산성’ 단계에서는 이러한 발전적 단계를 통한 테크놀러지가 여러 분야를 아우르는 전방위적 적용을 의미하면서 결국 테크놀러지의 우위가 증명되고 대중들에게 널리 받아들여지는 단계를 보여준다.


빅데이터의 엔터프라이즈 활용
소위 빅데이터 시대를 맞아 많은 관련 회사들이 생겨나고 기존의 IT 기업들도 이러한 빅데이터 전문 분야를 키우고 있다. IBM, EMC, 오라클, SAP, SAS, 테라데이타 등은 각자의 빅데이터 영역을 개척 및 발전시키며 이제 빅데이터 비즈니스를 통해 수익창출을 기대하고 있다. 이들은 지난 몇 년 동안 수천억 달러가 넘는 빅데이터 관련 투자를 했으며 빅데이터 기술 관련 업체를 꾸준히 인수 합병 중이다. 주요 전략으로는 빅데이터 선별, 분석, 관리를 도맡아 하는 솔루션을 제공하고 이를 통해 비즈니스 분석, 컨설팅을 종합적으로 제공하는 것을 포함한다. 특히 가공된 수준 높은 정보의 질을 요구하는 엔터프라이즈급 빅데이터 비즈니스는 이들의 주요 타겟이다.

국내의 빅데이터 기술 발전과 비즈니스화에 가속도가 붙으며 현재 IT를 다루는 거의 모든 업체들이 참여하는 분위기다. 이에 따라 포털업체, 이동통신 사업자, 하드웨어 제조업체, SI 업체 등이 빅데이터를 분석 및 활용하는 솔루션을 내놓으며 새로운 비즈니스 기회를 노리고 있다.

빅데이터 비즈니스는 특히 비정형 데이터의 처리 기술에 초점을 맞추고 있다. 전 세계적인 관점에서 봤을 때 20%가 정형, 80%가 비정형 데이터로 판단되므로 모바일, 소셜 네트워크,  클라우드, 유비쿼터스 컴퓨팅 환경 하에서 막무가내식으로 저장, 생산되는 비정형 데이터의 가공, 손질, 제품화는 비즈니스화의 첫 단계다. 현재 텍스트 기반 ‘검색’과 ‘마이닝’ 기술을 통한 비즈니스, 엔터프라이즈화가 일반화돼 있지만 앞으로는 멀티미디어를 아우르는 빅데이터 기술의 발전이 예상된다. 이는 하둡, R, NoSQL 데이터베이스 등과 같은 오픈소스 테크놀러지들의 급격한 발전을 초래하는 한편, 이와 같은 오픈소스 테크놀러지들의 발전에 따라 비정형 데이터 분산 처리 기술, 통계적 분석 기술, 실시간 스트리밍 분석 기술, 스케일링, 또 대용량 데이터 저장 기술의 발전이 통합적으로 지속된다. 

빅데이터의 비즈니스/엔터프라이즈 활용은 하드웨어, 소프트웨어적 특성에 따라 마케팅의 최적화, 개별적/팀 단위의 성과, 리스크 관리에 매우 효과적인 솔루션을 제공한다. 이는 사업 전반에 걸쳐 적용 가능하며 데이터 분석의 소스는 어느 단체/기업 구성원들이 제공하는 정보뿐 아니라 기사, 블로그와 같은 전문적이거나 소비자가 생성한 데이터를 모두 아우른다. 특히 지난 20년간 폭발적으로 증가한 데이터 소스인 웹, 이메일, 블로그 및 소셜 미디어는 현재의 빅데이터 분석 및 연구를 통한 비즈니스를 가능하게 한다. 예를 들어 빠른 시간에 빅데이터를 분석해 시각화하고 예측할 수 있는 ‘인메모리 분석’과 같은 기법은 기업 이미지와 브랜드에 대한 평판, 또 사용자들의 반응을 실시간으로 분석, 판단할 수 있는 툴을 제공한다. 이에 따라 브랜드에 대한 충성도나 호의적 반응, 또는 긍정 및 부정적 요인에 대한 좀더 자세하고 정확한 정보를 얻을 수 있다.


빅데이터 활용의 핵심
빅데이터를 다루는 기술의 핵심 요소들은 근래에 발전하는 테크놀러지들의 다양한 측면들이 고려된 인간 중심의 테크놀러지에 기인한다. 스토리지, 클라우드, 모바일, 시맨틱, 개인화, 컨텍스트 인식, 웹 3.0, 머신러닝 등과 같이 인텔리전스가 가미되는 테크놀러지들은 개인을 중심으로 빅데이터를 담아서 분석, 활용, 적용할 수 있는 최적의 환경을 만들어 나가고 있다.



< 그림 4> 빅데이터 애플리케이션 세그먼트(출처 :  Panasas)


<그림 4>와 같이 빅데이터를 활용하는 애플리케이션은 대표적인 4D 세그먼트로 나눌 수 있다. ‘디자인’은 엔지니어링 협업과정을 나타내는 것으로서 프로세스 플로우, 3D 모델링과 같은 세부 과정이 있을 수 있다. 비정형 데이터로부터 밸류(value)를 찾을 수 있도록 디자인하는 것이 대표적인 예다. ‘디스커버’는 시뮬레이션, 비주얼라이제이션과 같이 데이터를 찾는 일련의 과정을 말하며 ‘디시젼’은 빅데이터 분석을 나타내며 디시젼 프로세싱, 행동 분석과 같은 과정이다. 마지막으로 ‘디포짓’은 데이터웨어하우징, 웹 2.0 데이터와 같은 물리적 데이터 백업 솔루션을 말한다. 이러한 대표적인 네 가지 빅데이터 세그먼트는 확장성(Scalability)와 성능(Performance)을 모두 고려해 적용될 수 있다.

빅데이터 활용의 핵심 테크놀러지 및 제반 컴퓨팅 환경들은 다음 여덟 가지로 요약된다.


● 클라우드 컴퓨팅

기하급수적으로 늘어나는 데이터 볼륨, 인터넷 액세스 포인트와 인터넷 스피드는 클라우드 컴퓨팅 환경 하에서의 빅데이터 활용에 접근성을 높이고 나아가 더 실제적인 활용을 가능하게 한다. 이러한 클라우드 컴퓨팅 하에서의 빅데이터 활용은 빅데이터를 뽑아내고 분석하고 인텔리전스에 의거한 액션 플랜을 생산 및 배출하는 것에 최적화돼 적용될 수 있다.


● 스토리지(Storage)

수많은 디지털 디바이스들의 등장과 연관 테크놀러지들의 발전으로 개인, 기업, 단체들이 저장하는 데이터의 크기가 늘어났다. 이와는 반비례로 데이터 저장장치들의 가격은 점점 내려가고 있다. 하지만 데이터 크기의 증가가 더욱 가파른 곡선을 따르므로 데이터를 안전하고 효율적으로 저장하는 테크놀러지의 발전이 요구된다. 예를 들어, 데이터의 손실을 방지하기 위한 방편으로 채택되는 미러링과 분산 저장 방식이 존재한다. 이는 단순 저장이 아닌 주요 메타데이터를 뽑아 저장하는 방식(Primary Storage Tier)을 채택한다. 빅데이터 시대의 스토리지 솔루션을 위해 더욱 효과적이고 효율적인 저장방식이 활발히 연구 개발되고 있다.


● 모바일 테크놀러지

근래의 IT 트렌드는 모바일이 대세이다. 모바일 TV, 모바일 스마트폰, 그리고 자동차의 전장부품 장치가 대표적이다. 몸에 휴대하든 자동차에 타든 인터넷에 연결된 모바일 기기들은 장소 정보로부터 시간대별 사용자 행동 정보에 이르기까지 쏟아내는 데이터의 양이 엄청나다. 스마트폰 앱을 사용해 음식점을 찾고 방문하는 그 모든 과정과 위치정보가 고스란히 서버에 저장된다. 

또 국내의 삼성전자가 현대자동차와 전장부품, 반도체 사업에서 격돌하고 있는 양상은 자동차에서 자동주행장치, 차선이탈방지장치 등 외에도 정보처리 장치가 핵심이 됨을 간접적으로 보여준다. 즉, 인터넷에 연결돼 페이스북에 운전 중 사진을 포스팅할 수 있는 정보처리, 분석 장치의 중요성이 대두되고 있다. 최근 BMW가 USIM 슬롯을 제공해 자동차가 하나의 LTE 모뎀으로 인식, 커넥티드 드라이브를 장착하고 음성인식을 이용해 인터넷에 접속하며 이메일을 읽고 보낼 수 있는 서비스를 내년까지 선보인다고 한다. 이와 같이 인간이 움직이면서 정보를 만들어낼 수 있는 환경은 이미 우리 생활과 매우 밀접해졌다.


● 소셜 미디어

혹자는 빅데이터와 소셜 미디어의 결합은 최고의 결합이 될 것이라고 한다. IBM이 2011년 발표한 통계에 의하면 구글, 페이스북, 트위터와 같은 소셜 미디어가 만들어내는 정보의 양이 매일 2.5퀸틸리온(Quintillion)바이트라고 한다(1퀸틸리온바이트 = 10억 기가바이트). 간단한 예를 들어, 어느 마케터가 자사 제품에 대한 피드백을 얻기 위해 소셜 미디어 공간에 질문과 토론의 장을 마련했다고 가정해 보자. 그러면 정도의 차이는 있겠지만 관심 있는 이들의 수많은 포스팅을 얻게 될 것이다. 이러한 소셜 미디어 환경의 빅데이터 분석은 어느 제품이나 서비스의 수요와도 직결되는 결과를 나을 수 있다. 즉, 정보의 통합, 분석이 회사/기관의 액션(action)으로 연결될 가능성이 크다. 소셜 미디어에서의 빅데이터는 전략적 인사이트(insight)를 얻는 데 현재 가장 각광 받는 소스로 인식되고 있다.


● 분산 기술 및 새로운 데이터베이스 모델

빅데이터 활용은 기존의 테크놀러지들로는 처리할 수 없을 정도라서 새로운 개념의 하드웨어적, 소프트웨어적 솔루션을 요구한다. 예를 들어 하둡(Hadoop)과 NoSQL 데이터베이스는 빅데이터를 이야기할 때 빠지지 않는 빅데이터 솔루션을 위한 오픈소스 테크놀러지다. 하둡으로 분산해 대용량의 빅데이터를 효과적으로 처리하고 이와 함께 NoSQL 데이터베이스를 사용해 기존의 RDBMS로 처리하지 못하는 빅데이터를 여러 대의 컴퓨터에서 프로세싱한다. 지정되지 않는 데이터베이스 스키마를 사용해 거대한 볼륨의 데이터를 분산 처리할 수 있게 된 것이다. 

따라서 결국애드온(add-on), 크로스 인티그레이션(cross-integration), 커스터마이제이션 (customization)을 얼마나 적절히 사용하느냐에 따라 빅데이터 활용의 성공 유무가 결정되며 맵 리듀스(MapReduce)와 같은 테크놀러지들이 속속 등장해 빅데이터 활용에 사용되고 있다.


● 인공지능 테크놀러지

빅데이터를 처리하고 활용한다는 것은 데이터에서 의미 있는 정보를 얻어내는 것을 말한다. 이를 위해서는 자동으로 데이터를 처리하고 수집된 데이터들 사이의 관계 및 영향을 알아내며 때로는 단편적 데이터 조각들에서 의미(Semantic)와 컨텍스트(Context)를 인식할 수 있어야 한다. 이러한 측면에서 활용되는 테크놀러지들로는 머신 러닝(Machine Learning), 데이터 마이닝(Data Mining), 그리고 시맨틱/컨텍스트 인식 테크놀러지들이 있다. 또한 자연어 처리(Natural Language Proc essing), 이미지, 멀티미디어 프로세싱(Image Processing), 패턴 인식(Pattern Recognition), 통계 분석(Statistical Analysis) 등과 같은 근간이 되는 테크놀러지들의 적용이 요구된다.


● 개인화(Personalization)

빅데이터라는 테두리 안에서 보면 결국 데이터를 만드는 주체는 개개인이다. 회사의 일원인 개인일 수 있고 스타벅스에서 커피를 마시는 개인일 수 있다. 단지 데이터가 생성될 때의 컨텍스트(Context)가 다를 뿐이다. 따라서 빅데이터를 통한 개인화는 필연적이며 이미 개인화된 서비스가 출현하고 있다. 이는 빅데이터의 일차원적 활용이 아닌 종합적 활용이어야 한다. 

‘라이프로그(Lifelog)’는 개개인의 단편적인 정보를 수집, 기록해 사실 파악을 위한 토대를 제공한다. 예를 들어, 지난 주말에 무엇을 했는지 알아보려면 일기를 들춰보면 되는 것과 같다. 하지만 빅데이터에서의 개인화는 이러한 단편적 정보에 의존하지 않는다. 주변 모든 정보를 고려한 개인의 과거, 이에 근거한 미래를 이야기한다. 예를 들어, 지난 주말에 강남역의 세븐 일레븐에서 사이다를 사먹었는데, 그날의 날씨와 교통정보를 들여다보니 가까운 미래 주말의 비슷한 상황에서 사이다를 사 먹을 가능성이 있다고 예측할 수 있는 것이 빅데이터를 개인화에 활용하는 방법이다. 물론, 그만큼 다양한 항목의 데이터 수집이 요구된다. 그리고 개인 정보의 수집에 어려움이 있고 개인 모델과 데이터 검증이 쉽지 않다. 이러한 걸림돌에도 불구하고 빅데이터를 통한 개인화가 이슈로 떠오르는 이유는 마케팅과 비즈니스에 직접적인 영향을 미칠 수 있는 개인화된 모델을 효과적으로 수립할 수 있기 때문이다.


● 보안(Security)

빅데이터를 활용할 때 주요 걸림돌이 되는 것은 보안 및 프라이버시 침해다. 역설적으로, 빅데이터를 위한 보안 및 프라이버시를 위한 솔루션 개발의 필요성이 대두된다. 보안과 프라이버시는 빅데이터를 분석해 광고에 활용하거나 마케팅 수단으로 사용할 때 반드시 고려돼야 할 중요한 이슈다. 

최근 구글의 예만 보더라도 개인의 프라이버시가 간과된 빅데이터 분석이 초래할 문제의 심각성을 알 수 있다. 7월 10일자 월스트리트 저널에 의하면 구글은 애플의 사파리 웹브라우저 사용자들의 인터넷 사용을 추적한 사실에 대해 미국 FTC(Federal Trade Commission) 기구에 의해 2,000만 달러가 넘는 벌금을 지불하게 됐다. 현재 구글의 혐의는 인정됐고 FTC의 승인만이 남아있는 상태다. 구글의 소셜 네트워크 서비스인 구글 플러스의 ‘+1’이라는 서비스를 사파리 웹브라우저를 통해 사용하면 쿠키에 저장된 사용자 이용 패턴을 분석 가능한 것이 문제가 됐다. 

전 세계인들이 사용하는 상위 100여개의 사이트를 접속할 때 이러한 사용자들의 행동패턴이 분석되도록 한 것이다. 이렇듯 이용자의 인터넷 또는 서비스 사용 패턴을 분석하면 직간접적인 비즈니스를 할 수 있지만, 개개인의 프라이버시와 보안을 고려하지 않은 데이터 수집은 도의적인 측면뿐 아니라 법률적인 측면에서도 문제가 된다. 

이러한 상황은 이미 빅데이터를 통해 리서치 및 비즈니스를 수행하려는 연구기관과 회사들에 의해 인지되고 이를 위한 해결책이 마련되고 있다. 특히, 빅데이터 비즈니스를 추진하는 회사들은 보안 및 프라이버시의 심각성 및 필요성에 의해 보안 정보, 위험 관리, 로그 관리, 보안 이벤트 관리 등을 솔루션 부분에 포함시켜 빅데이터 분석 및 활용 방법을 제시하고 있다.


빅데이터 활용, 장기적인 관점으로 바라보다
2012년은 빅데이터의 시대로 들어가는 원년이다. 스마트폰, 태블릿PC, 게임 콘솔, 인카(in-car) 전자시스템 등 빅데이터를 만들어내는 인프라가 형성되고 기업, 기관, 개인들은 이를 통해 정보를 쏟아내고 있는 시기다.

빅데이터를 어떠한 상황에서, 어떠한 목적으로 또 어떻게 활용할지는 각자의 몫이다. 퍼스널 컴퓨터가 대중화되기 시작하면서 오피스 프로그램들이 우후죽순으로 생겨나다 마이크로소프트의 오피스가 대세로 굳어졌듯, 인터넷 시대에 넷스케이프, 인터넷 익스플로러, 그리고 구글 서치 엔진이 대표 소프트웨어 및 서비스로 자리 잡고 전 세계 18억 명이 온라인에 접속하며 페이스북이 핵심 소셜 네트워크로 인정받았듯이, 빅데이터 시대에도 분명 대표 하드웨어, 소프트웨어 및 서비스가 생겨나게 마련이다. 

이제 빅데이터 활용의 핵심과 본질을 통해 큰 그림을 보자. 이기종들 간의 컴퓨팅, 모바일 테크놀러지, 컨텍스트 인식, 사용자 중심 컴퓨팅, 클라우드 및 인공지능 테크놀러지를 고려하고 인류에게 도움이 되는 특별한 그 무언가를 준비한다면 빅데이터라는 시대적 조류에서 큰 기회를 얻을 수 있을 것이다.



/필/자/소/개/

신종호jonghoshin9@gmail.com

USC(University of Southern California)에서 Computer Science 박사 학위를 받았다. 미국 Emory 대학 Math& Computer Science 학과에서 Postdoctoral Fellow로 재직 중이며 사용자 중심 컴퓨팅, 정보검색 멀티모달 인터페이스 리서치를 진행하고 있다. 미국 Idealab X1, SpeechWorks(현재 Nuance)에서 소셜, 정보검색, 인터페이스 개발 프로젝트를 맡았고, 삼성전자, LG전자에서 미래지향 임베디드, 모바일 관련 프로젝트를 수행한 바 있다. 데이터 마이닝, 사용자 인터페이스 및 모델링 관련 세미나 강연과 컬럼 기고 등을 진행 중이다.



※ 본 내용은 (주)마소인터렉티브(http://www.imaso.co.kr/)의 저작권 동의에 의해 공유되고 있습니다.
    Copyright ⓒ Maso Interactive Corp. 무단전재 및 재배포 금지

맨 위로
맨 위로