9월 15일
ⓒ 디지털데일리, 이상일 기자, 2401@ddaily.co.kr
정부가 디지털 뉴딜의 일환으로 ‘데이터 댐’ 전략을 들고 나온 가운데 오픈소스 기반의 ‘데이터레이크’ 구축 전략이 화두로 떠오르고 있다.
약 5조원이 투자되는 데이터 댐이 성공하기 위해선 우선 데이터 레이크에 대한 고민이 우선돼야 한다는 지적이다.
데이터를 컨트롤할 수 있는 것이 댐이라고 한다면 댐 안에 들어간 정형, 반정형, 비정형 등 광범위한 데이터를 컨트롤해 줄 수 있는 데이터 레이크를 어떻게 구축하느냐가 데이터 댐의 주요 키워드로 부각되고 있다. 데이터 레이크는 기존 데이터웨어하우스(DW)보다 확장된 개념으로 말 그대로 데이터의 호수만큼 방대한 정보를 저장하는 체계를 의미한다.
인젠트 노웅영 상무는 “데이터 레이크를 어떻게 구축하느냐가 뉴딜의 주 키워드다. 그래야 국가에서 얘기하는 데이터댐의 기본 밑바탕이 완성될 것”이라고 밝혔다.
특히 그는 데이터 레이크 구축을 위해서 오픈소스DB와 상용DB의 상호 연결성이 주요 화두가 될 것이라고 지적했다.
상용DB에서 오픈소스 DB로 데이터의 흐름이 그동안 주로 이뤄졌다면 이제 대세가 된 오픈소스DB에서 상용DB로도 원활히 데이터가 흐를 수 있도록 아키텍처에 대한 고민이 필요하다는 주장이다.
노웅영 상무는 “데이터 댐이 성공하기 위해선 데이터의 흐름에 대해 벽이 없어야 한다. 상용 DB에서 오픈소스 DB로 데이터 전송이 가능한 것처럼 이제 오픈소스 DB에서도 상용DB로 데이터가 흐를 수 있어야 한다. 융합의 관점에서 상용과 오픈소스 한 쪽을 사장시킬 수 없고 병행해야 한다”고 강조했다.
오픈소스 DB에 대해 그동안 벌어져 왔던 비용과 성능의 이슈는 거의 해결된 지 오래다. 카카오뱅크와 같은 곳은 오픈소스 기반의 데이터베이스를 계정계시스템에 사용할 정도다.
이처럼 상용DB를 제치고 오픈소스DB가 기업의 핵심 시스템으로 자리 잡는 경우가 발생했다. 따라서 이제 오픈소스 DB에서 상용 DB로 데이터를 넘겨줘야 하는 상황이 왔다. 예를 들어 오픈소스 기반의 코어 시스템에서 상용DB로 구현된 정보계, 대외계 채널에 정보를 전달하는 경우다.
다양한 데이터베이스, 하둡, 모바일 등의 다양한 데이터 소스에서 데이터레이크로 흘러가기 위해서는 확장성, 안정성, 비용, 데이터변환 등 요건이 더욱 커졌다.
다만 상용DB가 대세인 까닭에 상용 DB에서 데이터를 오픈소스 DB로 이전하기 위한 다양한 연계 솔루션이나 기술들이 대중화됐다. 하지만 역으로 가는 데이터 흐름을 지원하기 위한 기술과 서비스 생태계는 아직 이에 미치지 못한다.
노웅영 상무는 “상용DB와 협력, 그리고 상호간 데이터 흐름을 얘기하는 곳은 우리밖에 없다고 생각한다. 이는 우리의 대형고객이 이미 데이터량이 폭증하며 선제적으로 대응하고 있는데 이를 지원하다 보니 DB에 있어 제기되는 문제에 있어서도 선제적으로 대응하는 선순환이 이뤄지고 있기 때문”이라고 밝혔다.
실제 인젠트의 경우 오픈소스 DBMS인 ‘포스트그레DB’를 기반으로 ‘엑스퍼DB’를 개발, 시장에 보급하고 있다. 엑스퍼DB 관련 30여명의 직원이 오픈소스 DB 업무를 맡고 있다, 이들 모드 상용DB 개발 경험이 있는 인력들이다.
노웅영 상무는 “과거 엔지니어들이 오픈소스를 꺼려했던 이유가 그동안 쌓아왔던 상용DB에 대한 노하우를 버려야 한다는 것이었는데 이제는 상용DB를 알아야 오픈소스DB와 핵심적인 연결을 이뤄내는 등 도움이 되는 시대가 왔다”고 말했다.
※ 본 내용은 (주)디지털데일리 (http://www.ddaily.co.kr/)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ (주)디지털데일리. 무단전재 및 재배포 금지
0개 댓글