본문 바로가기

Home > 정보마당 > 공개SW 활용 성공사례

공개SW 활용 성공사례

[공개SW 활용 성공사례 44] 넥슨 - 통합 IT 인프라 모니터링 체계 구축

OSS 게시글 작성 시각 2012-08-02 11:04:42 게시글 조회수 1504

모든 수치 데이터를 시각 지표로 표현하는 공개SW로

통합 IT 인프라 모니터링 체계 구축

일찍이 해외 시장 공략에 나섰던 넥슨은 전 세계 13억 명의 가입자(2011년 12월 기준)를 확보했고 올해 첫 2조 원 대 매출 달성이 기대되고 있다. 이 회사는 차별화된 콘텐츠와 인수합병 전략으로 해외 경쟁력을 강화해왔지만 분산된 관리 체계, 운영상의 비효율, 표준화된 관리 지침 부재, 높은 TCO 등에 대한 개선 요구에 직면함에 따라 그 해결책으로 공개SW인 CACTI 기반의 ‘IT 인프라 운영 관리 시스템’을 구축했다. 이 과정에서 유연한 확장성과 자유로운 커스터마이징이 가능한 공개SW 활용으로 보다 신속한 장애 대응 체계를 구축하고 백데이터 분석에 의한 장애 예방이 가능해진 넥슨은 이번 공개SW 도입이 안정적인 서비스 기반 마련과 성공적인 글로벌 시장 진출에 일조한 것으로 평가하고 있다.

- 기     관

넥슨

- 수행년도 2010년~현재
- 도입배경 분산된 관리 체계의 통합 필요 증대, 운영상의 비효율 해소, 표준화된 관리 지침 요구 증가
- 솔 루 션 CACTI, 리눅스, MySQL, 몽고DB, 카산드라, 멤베이스(Membase), 멤캐시드(Memcached), 바니시(varnish)
- 도입효과 : 신속한 장애 대응 및 사전 대응 체계 구축, IT 인프라와 모든 수치화 가능한 모든 서비스까지 모니터링, TCO 절감 및 운영 수준 평준화

넥슨 로고
1994년 창립된 넥슨은 세계 첫 그래픽 온라인 게임인 ‘바람의 나라’와 부분유료화란 새로운 수익 모델이 처음 시도된 ‘퀴즈퀴즈’ 등 새로운 게임 장르를 끊임없이 개척해왔다. 전 세계 100여개 국에 50여종의 게임을 서비스하는 글로벌 엔터테인먼트 기업으로 성장한 넥슨은 최근 북미와 중국 시장 공략에 적극 나서면서 이 분야의 ‘글로벌 톱5’로의 도약을 모색 중이다. 넥슨의 이와 같은 해외 게임시장 진출에는 철저한 시장 분석을 통한 콘텐츠의 현지화(localization)와 현지 시장에 맞는 선진화된 과금 시스템 개발뿐 아니라 대규모 인프라의 효율적인 운영을 가능케 한 공개SW의 기여도 있었다.


대규모 IT 인프라에 대한 모니터링 필요 증가


넥슨은 게임 콘텐츠를 캐릭터 상품으로 육성하기 위해 원소스 멀티유즈(One Source Multi Use) 전략을 내세우는 한편, 스마트폰과 태블릿PC의 확산으로 급변하는 시장 상황에 맞춰 SNS와 모바일 플랫폼에까지 사업 영역을 확장했다. 그 결과 넥슨은 올해 매출이 2조 원을 넘어설 것으로 전망될 만큼 기업 외형이 확대됐지만, 성장 과정에서 사업 다각화와 글로벌 진출로 인한 분산된 관리 체계, 빈번한 인수합병으로 인한 운영상의 비효율, 표준화된 관리 지침 부재 등에 따른 현실적인 개선 요구에 맞닥뜨려야 했다.
이에 넥슨은 그 해결 방안으로서 광범위한 IT인프라를 통합 모니터링할 수 있는 ‘IT 인프라 운영 관리 시스템’ 구축을 결정하고 공개SW인 CACTI를 도입했다. 종속성 탈피, 운영상의 리스크 최소화, TCO 절감, 통합 모니터링 체계 구축, 운영 효율화, 표준화된 체계 마련 등의 목표 하에 추진된 이번 공개SW 도입에 대해 박지성 넥슨 포털본부 인프라기술실 라이브시스템팀 과장은 “다양한 상용SW를 검토했지만 서버 모니터링에만 수십억 원이 요구돼 다른 대안을 검토하게 됐다”면서 “운영 중인 IT 인프라에 영향을 최소화하면서 원하는 수준의 통합 모니터링 시스템을 구축하는 데 CACTI가 최적이라고 판단했다”고 설명했다. 그의 설명에 따르면 공개SW인 RRDTOOL과 연계된 CACTI는 트리 형태의 뷰를 제공하고 다양한 수치를 그래프 등의 시각적인 지표로 표현할 수 있다. 또한 다양한 스크립트나 플러그인이 이미 공개돼 상용SW에 버금가는 기능을 제공할 뿐 아니라 전 세계적으로 인정받는 네트워크 관리 시스템(NMS)으로서 그 우수성이 이미 입증돼 있다




커스터마이징으로 광범위한 인프라 모니터링 체계 구축

넥슨은 자사의 광범위한 인프라를 통합 모니터링하기 위해 IT 인프라 운영 관리 시스템의 첫 계층인 정보수집에 CACTI를 도입하고 CACTI의 UI와 아키텍처에 대한 커스터마이징을 실시했다. 이에 대해 안보갑 넥슨 포털본부 인프라기술실 라이브시스템팀 팀장은 “SNMP(Simple Network Management Protocol)로 능동적으로 데이터를 수집하는 CACTI는 광범위한 IT 인프라를 모니터링할 경우 데이터 수집과 RRD 업데이트 시 부하가 큰 문제가 있었다”고 도입 당시를 떠올렸다. 이를 개선하기 위해 넥슨은 CACTI의 능동적인 정보 수집 기능을 인프라별로 독립된 서버에 분산하고 각 서버가 능동적으로 일괄 취합한 각종 수치를 FTP 프로토콜로 CACTI 서버에 전송하도록 커스터마이징했다. 이와 함께 RRD 업데이트 부하를 개선하기 위해 레이드 컨트롤러에 쓰기 캐시를 추가하고 가급적 하나의 RRD 파일에 데이터가 업데이트되도록 데이터 템플릿도 변경했다. 커스터마이징을 통한 효과적인 부하 분산 덕분에 CACTI가 대규모 IT 인프라에 성공적으로 도입됐을 뿐 아니라 수치화할 수 있는 모든 서비스에 확대 적용하는 유연성도 확보됐다.




수집된 백데이터 분석 통해 신속한 문제 대응 체계 구축

공개SW로 대규모 IT 인프라에 대한 효과적인 모니터링 체계를 구축한 넥슨은 IT 인프라 운영 관리 시스템을 시스템 성능, 네트워크 트래픽, 동시접속자 수, 웹서비스, 게임 프로세스, DBMS 외에 매출, 견적, 자산관리 등 모니터링이나 알림이 필요한 다양한 서비스에도 확대 적용했다. 또한 사내의 공통 로그인 시스템과 IT 인프라 운영 관리 시스템을 연동해 통합 인증 체계를 구축하는 한편, 각 IT 인프라를 특성에 따라 그룹으로 구성해 피드백할 수 있는 CACTI 플러그인을 자체 개발했다. 이로써 호스트나 그룹에 미리 설정된 임계치를 초과하는 경우 공통 로그수집 시스템에서 각 담당자에게 메일이나 SMS로 알림을 보내 예기치 못한 장애에도 신속히 대응할 수 있는 체계를 확립했다. 이와 함께 수집된 데이터를 2년간 보관함으로써 성능 변화 추이를 분석해 이슈가 발생하기 전에 시스템 가용성을 미리 확보하는 등 장애 포인트도 사전에 제거할 수 있었다. 이에 대해 박지성 과장은 “기존에는 DBMS, 시스템, 네트워크 등을 각 조직별로 운영했던 터라 이런 각각의 요소가 연관된 장애를 기존의 모니터링 체계로 대응하는 데 어려움이 많았다”면서 “광범위한 IT 인프라의 주요 지표를 한눈에 파악하고 대응할 수 있어 동시접속자 수가 급격히 증감하는 등의 변화를 사전 감지해 서비스 장애를 더 신속히 파악하고 원활하게 처리할 수 있게 됐다”고 CACTI 도입 효과를 설명했다.
국내 게임 업체로서 해외 시장에 일찍 눈을 돌린 넥슨은 글로벌 시장 진출에도 IT 인프라 운영 관리 시스템이 한몫한 것으로 평가한다. 원격지에서 CSV 형태의 데이터를 전송하면 CACTI에서 이를 그래프 등의 시각화된 지표로 표현할 수 있어 현지의 IT 인프라나 프로모션사의 기술적 요인으로 인한 서비스 운영상의 어려움을 국내에서 원격 지원해 해결할 수 있었다.




공개SW로 기업 경쟁력 강화 ‘박차’

공개SW가 세계적인 트렌드가 된 현실을 반영해 넥슨은 IT 인프라 운영 관리 시스템을 시작으로 공개SW를 기업 내에 확산시키는 분위기다. 사내에 별도의 TF 팀이 구성돼 공개SW에 대한 연구와 기술 검토를 수행하고 있으며, 이에 따라 HAProxy, 하둡, 레디스(redis), 오픈스택, 클라우드스택, Node.JS 등의 공개SW 도입이 적극 검토되고 있다. 또한 넥슨은 신규 게임 서비스에 공개SW인 리눅스나 맴캐시 등의 도입을 확대하는 등 공개SW 활용을 통한 기업 경쟁력 강화를 위해 전사적인 노력을 다하고 있다.

-----------------------------------------------------------------------------------------------------------------------------
[인터뷰]

공개SW 본질인 ‘참여와 공유’ 실천할 때
넥슨 포털본부 인프라기술실 라이브시스템팀 박지성 과장, 안보갑 팀장


넥슨 포털본부 인프라기술실 라이브시스템팀 박지성 과장
Q> 공개SW 도입이 세계적인 트렌드로 자리 잡는 상황에서 국내 현실을 평가한다면
페이스북, 트위터 등 공개SW를 적극 활용하는 기업들은 매우 우수한 자체 기술력을 보유하고 있다. 그들은 공개SW를 단순히 도입만 하기보단 스스로 공개SW 프로젝트에 참여하고 지원하면서 함께 성장해 가고 있다. 국내에서도 공개SW 도입이 점차 확대되고 있지만 공개SW와 함께 성장하려는 의지는 여전히 부족하다. 따라서 글로벌 기업의 다양한 사례로부터 공개SW의 진정한 의미를 이해하고 나아가 공개SW의 성공적인 도입은 공유에서 시작된다는 점을 인식해 실천해야 한다. 공개SW의 철학인 참여와 공유가 실천돼야 모두에게 이득이 된다는 사고의 전환이 필요한 시점이다.



넥슨 포털본부 인프라기술실 라이브시스템팀 안보갑 팀장
Q> 공개SW를 도입하기 전에 어떤 고려가 필요한가
공개SW 전문 인력에 대한 고려 없이 공개SW를 도입할 경우 오히려 그 도입이 기업에게 리스크가 될 수 있다. 이런 까닭에 리눅스나 MySQL처럼 이미 검증된 공개SW가 아닌 경우에는 도입 단계에서 발생할 수 있는 여러 문제를 사전에 충분히 검토해야 한다. 공개SW 도입 과정에서 확고한 공개SW 도입 가이드가 먼저 마련돼야 하는 것도 이런 이유에서다.
또한 대부분의 글로벌 기업들이 공개SW의 도움으로 성장하고 있는 만큼 공개SW 도입이 피할 수 없는 흐름이라는 분명한 인식을 바탕으로 공개SW 활성화에 동참하고 성공적인 운영과 도입을 도울 전문가 육성에도 노력을 기울여야 한다.


-----------------------------------------------------------------------------------------------------------------------------




- 마이크로소프트웨어 조수현 기자 suhyeoni@imaso.co.kr

- 공개SW 역량프라자

맨 위로
맨 위로