본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

[용어 아하!] 하둡(Hadoop)

OSS 게시글 작성 시각 2014-01-03 17:27:26 게시글 조회수 3548

2014년 01월 03일 (금)

ⓒ 디지털타임스



하둡은 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술입니다. 수천대의 분산된 x86 장비에 대용량 파일을 저장할 수 있는 기능을 제공하는 분산파일 시스템과, 저장된 파일 데이터를 분산된 서버의 CPU와 메모리 자원을 이용해 쉽고 빠르게 분석할 수 있는 컴퓨팅 플랫폼인 맵리듀스로 구성돼 있습니다.


하둡은 아파치 루씬 창시자로 유명한 더그 커팅이 만들었습니다. 커팅은 이렇게 개발한 기술을 다른 개발자도 자유롭게 가져다 쓰고 발전시킬 수 있도록 소스코드를 공개했습니다. 하둡이라는 이름의 유래는 커팅의 딸이 가지도 놀던 봉제인형 이름이라는 얘기도 있고 딸이 코끼리란 단어를 `하둡'이라고 발음해 지었다는 설도 있습니다.


하둡은 저렴하면서도 방대한 데이터를 분석할 수 있게 돕기 때문에, 기업은 하둡을 활용해 빅데이터 분석에 들어가는 초기 비용을 줄이면서 자사 데이터 시스템과의 호환 문제도 손쉽게 해결할 수 있습니다. 이런 장점들이 알려지며 하둡은 빅데이터 처리와 분석을 위한 플랫폼 시장에서 사실상 표준으로 자리잡았습니다.




※ 본 내용은 (주)디지털타임스(http://www.dt.co.kr/)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ 디지털타임스. 무단전재 및 재배포 금지


[원문출처 : http://www.dt.co.kr/contents.html?article_no=2013121602010860718002]

맨 위로
맨 위로