본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

맵알의 새로운 하둡 배포판으로 안전하게 업그레이드

OSS 게시글 작성 시각 2014-02-19 17:12:39 게시글 조회수 3281

2014년 02월 19일 (수)

ⓒ CIO Korea, Thor Olavsrud | CIO



맵알의 최신 하둡 배포판에는 YARNN과 함께 하둡 2.2 지원 기능이 들어 있다. 게다가 최신 하둡 아키텍처로 안전하게 업그레이드하면서 맵리듀스 1.x 스케줄러와도 호환된다.

맵알 테크놀로지(MapR Technologies)가 자사의 배포판을 경쟁사인 클라우데라(Cloudera)나 호튼웍스(Hortonworks)와는 차별화하였다. 맵알은 하위 호환성을 지원하여 기업이 클러스터의 동일한 노드에서 하둡 맵리듀스(Hadoop MapReduce) 1.x와 YARN 스케줄러(Scheduler)를 동시에 사용할 수 있다.

맵알의 CMO 잭 노리스는 “맵리듀스 1.x와 YARN 스케줄러가 공존할 수 있도록 함으로써 맵리듀스 1.x 사용자들이 쉽고 안전하게 새로운 스케줄러로 업그레이드할 수 있는 길을 제공하고 있다”고 강조했다.

"다른 종류의 애플리케이션에도 프로세싱을 개방하고 싶을 경우에 단순히 하둡을 활용하겠다는 이유로 애플리케이션을 재 작성하지는 않을 것이다." -- 잭 노리스, 맵알 테크놀로지 CMO

"우리는 하둡의 생산에 초점을 맞추고 있다"고 노리스는 말했다. "일단 생산을 시작하면 이용성, 가동시간, 기존 앱과의 통합이 중요해 진다. 생산 환경을 변화시키는 것이 그리 쉽지 않기 때문에 우리는 이전의 배포판부터 현 배포판까지 하위 호환성을 지원하고 있다. 고객들은 'YARN이 좋기는 하지만 일단 한 번 해보고 싶다. 이미 모든 것이 잘 되고 있다'고 말한다. 우리의 고객들은 플랫폼에서 하루 2만 개 이상의 작업을 처리하고 있다"라고 노리스는 설명했다.

아파치 하둡(Apache Hadoop) YARN(Yet Another Resource Negotiator)은 지난 10월에 공개된 하둡 2.0의 기초다. YARN은 하둡 운영체제로 동작하면서 과거 배치 처리를 위한 일회용 데이터 플랫폼이었던 것을 여러 번 사용할 수 있는 플랫폼으로 탈바꿈시킴으로써 배치, 상호형, 온라인, 스트림 프로세싱을 가능하게 한다.

YARN은 주요 자원 관리자이자 HDFS(Hadoop Distributed File System)에 저장된 데이터에 접근하기 위한 중간자 역할을 함으로써 기업들이 데이터를 한 곳에 저장하고 이와 수 차례에 걸쳐 상호작용할 수 있도록 함과 동시에 일정한 서비스 수준을 확보하고 있다.

노리스는 YARN을 맵알의 R/W(Read-Write) POSIX 데이터 플랫폼과 결합함으로써 맵알이 YARN 기반의 애플리케이션을 단순히 하둡 클러스터에서만 사용하고 컴퓨터 자원을 공유하는 것이 아니라 기본적인 분산형 파일 시스템과 데이터베이스 테이블에서 데이터를 읽고 쓰고 업데이트 할 수 있도록 한다고 말했다. 결과적으로 기업들은 더욱 광범위한 일련의 빅 데이터 애플리케이션을 개발하고 배치할 수 있게 된다.

EMA(Enterprise Management Associates)의 연구부장 에반 퀸은 "YARN은 단순한 맵리듀스를 넘어 프로세싱 패턴을 위해 하둡을 개방하고 있다"고 말했다. "맵알의 하둡 배포판은 HDFS 외에 완전한 개방 표준 NFS 인터페이스를 추가함으로써 YARN을 더욱 확대하여 맵리듀스 기반이 아닌 애플리케이션이 클러스터의 스토리지를 최적화해서 활용할 수 있도록 한다"라고 퀸은 덧붙였다.



※ 본 내용은 한국IDG(주)(http://www.itworld.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒITWORLD. 무단전재 및 재배포 금지


[원문출처 : http://www.ciokorea.com/news/19967]

맨 위로
맨 위로