본문 바로가기

Home > 정보마당 > 공개SW 활용 성공사례

공개SW 활용 성공사례

[공개SW 활용 성공사례 48] LG유플러스 - 사용자 패턴 분석 시스템 구축

OSS 게시글 작성 시각 2012-09-04 16:08:22 게시글 조회수 1486
“맵리듀스 적용한 분석 시스템 구축으로 맞춤형 서비스 구현 가능”

LG유플러스는 국내 이동통신 업계의 경쟁 포인트가 기술에서 서비스의 고도화 및 차별화로 변화했음에 주목하고, 이동통신 서비스 가입자의 모바일 기기 사용 패턴을 분석해 맞춤형 서비스를 제공하고자 ‘사용자 패턴 분석 시스템’을 구축했다. 그 과정에서 LG유플러스는 특히 분석에 쓰이는 데이터의 종류가 비정형 데이터인 점에 착안해 맵리듀스나 몽고DB와 같은 빅데이터 관련 공개SW를 적극 도입했다. 그 결과 패턴 분석 시스템의 핵심이라고 할 수 있는 다양한 사용자 패턴 데이터의 효율적인 분산 저장이 가능해졌다.

- 기     관 LG유플러스
- 수행년도 2012년
- 도입배경 이동통신 서비스의 고도화와 차별화를 위한 방안 모색. 그 과정에서 사용자의 모바일 기기와 웹 및 애플리케이션 사용 패턴을 분석하기 위한 시스템 구축 요구 증대
- 솔 루 션 맵리듀스(MapReduce), 몽고DB
- 도입효과 : 비정형 데이터인 사용자 패턴을 신속하게 분석할 수 있는 기반 마련. 이를 통해 사용자 맞춤형 서비스 개발 토대 구축

LG유플러스로고
2009년 말 LG그룹은 통신사업 계열사인 LG텔레콤과 LG데이콤 그리고 LG파워콤을 합병하기로 결정하고, 이듬해 7월 LG유플러스를 출범시키며 유무선 통신 및 방송통신 융합시대에 대응하고자 했다.

장소와 기기에 구애받지 않고 다양한 IT 기기를 연결하는 ‘U컨버전스’ 시대를 새로운 기업 비전으로 제시한 LG유플러스는 초고속 와이파이 망인 ACN(AP Centric Network)과 크로스 플랫폼 및 클라우드 인프라 구축 그리고 제 4세대 이동통신 기술인 LTE(Long-Term Evolution)의 조기 상용화를 핵심 사업으로 선정했다.

특히 LTE 장비 공급업체 선정과 LTE 전국망 구축 사업 등을 발 빠르게 추진해 국내에서 가장 먼저 LTE 서비스를 제공한 LG유플러스는 올해 초 데이터뿐만 아니라 음성과 문자 등을 동시에 제공하는 ALL-IP 기반 VoLTE(Voice over LTE)를 시연하면서 제 2의 도약을 위한 발판을 확보한 것으로 평가되고 있다.




서비스 차별화 위한 사용자 패턴 분석 필요

최근 이동통신 서비스 가입자 수 1,000만 명을 달성한 LG유플러스는 이제 기술 경쟁력을 확보하는 것만큼 서비스 품질 고도화와 차별화를 위한 새로운 전략이 필요하다고 판단했다. 이에 모바일 기기와 모바일 웹, 그리고 모바일 애플리케이션 이용에 대한 사용자 패턴을 심층 분석할 수 있는 시스템을 갖춤으로써 기술 경쟁력을 강화하면서 동시에 서비스 질을 향상시키는 데 회사의 관심이 모아졌다.

하지만 LG유플러스가 수행해온 사용자 패턴 분석은 정형 데이터의 경우 MySQL로 취합한 다음 그 내용을 통계 그래프로 만들어 웹에서 확인하는 방식이었고, 비정형 데이터는 내부 시스템이 아닌 별도로 구성된 팀이나 전문업체가 통계 수치를 추출해 분석했다.
특히 사용자 패턴 분석에 사용되는 데이터의 대부분이 모바일 기기의 종류부터 위치정보, 애플리케이션의 실시 및 종료시간, 특정 애플리케이션의 사용 빈도수, 사용자의 멀티미디어 정보 등 비정형 데이터인 것으로 나타나 빅데이터 기술을 적용한 분석 시스템을 시급하게 마련해야 한다는 의견이 대두됐다.

이에 회사 측은 사용자 패턴 분석 시스템에 도입할 빅데이터 기술의 효용성과 가치를 검증하고자 먼저 솔루션과 시스템, 아키텍처를 최소화해 프로토타입을 구축하기로 결정하고, 이후 분석결과에 대한 품질과 사업성을 고려해 전사적으로 활용할 수 있는 대형 시스템의 구축 계획을 수립했다.


맵리듀스와 몽고DB로 분석 시스템 기반 마련


사용자 패턴 분석 시스템의 핵심인 데이터 추출 및 1차 가공 부분을 담당한 카디날정보기술은 사용자 패턴 분석을 위한 로그 데이터가 단말기와 ADP(Application Data Processing), DSTA(Device and Service Transaction Analysis) 등 다양한 경로에서 유입된다는 점을 고려해 맵리듀스 기술을 적용하고, 1차 가공 처리된 데이터가 효율적으로 분산 저장될 수 있도록 시스템을 구현했다.
또한 분산 저장된 데이터에서 기초통계와 응용통계 그리고 기타 통계자료를 추출하려면 신속한 전달과 저장이 중요한 만큼 국내에서 활용도가 높은 NoSQL을 도입했고, 전달받은 데이터에 대한 저장은 몽고DB를 활용했다.

이와 관련해 이완희 카디날정보기술 사업기획팀장은 구축한 시스템은 다양한 모바일 기기 사용 패턴을 수집 Agent에서 xml 파일 형태로 파싱한 다음 해당 데이터에 맵리듀스 기술을 적용해 분석을 위한 1차 가공 데이터로 변환한다고 설명했다.

특히 수집된 데이터양이 많지 않을 경우 맵리듀스 적용이 오히려 시스템 부하를 초래할 수 있으므로 배치 작업을 통해서도 통계자료 추출을 위한 데이터가 수집되도록 시스템을 구축했고, 추출된 데이터는 사용 중인 관계형 데이터베이스(MySQL)에도 저장해 기존 시스템에서도 활용할 수 있도록 했다.


패턴분석시스템아키텍처
사용자 패턴 분석 시스템 구성도▲


“빅데이터에 대한 관심이 공개SW 활성화로 이어져”

맵리듀스와 몽고DB에 기반을 둔 사용자 패턴 분석 시스템은 선행 프로젝트로 진행됐던 만큼 사용할 수 있는 시스템 자원이 많지 않아 초기 성능에 대한 다양한 검증이 이뤄졌다.

실제로 상용 메모리 기반 데이터베이스와 몽고DB를 비교한 결과, 동시접속자 수가 적은 경우에는 상용 데이터베이스가 성능이 좋았지만 동시접속자 수가 많은 상황에서는 오히려 몽고DB가 더 나은 성능을 보여줬다. 이를 근거로 카디날정보기술은 패턴 분석 대상이 모든 서비스 사용자로 확대되면 몽고DB의 효율성이 잘 드러날 것으로 분석했다.
또한 구축 완료한 사용자 패턴 분석 시스템의 평균 쿼리 속도가 1만3,000TPS로 확인돼 최적화된 몽고DB 시스템 환경의 속도를 나타냈다. 이에 따라 전체 사용자를 대상으로 분석한 데이터를 저장하는 시스템이 완비되면 좀더 많은 사용자 패턴 데이터를 빠르게 저장할 수 있을 것으로 기대된다.

한편 LG유플러스는 이번 사용자 패턴 분석 시스템이 맞춤형 서비스를 제공하는 밑거름이 돼 서비스 질 개선에 기여할 것으로 기대하는 분위기다. 이와 함께 빅데이터의 활용 가치가 점점 높아지는 지금의 트렌드를 반영해 관련 공개SW에 대한 기술 경쟁력 강화에도 전사적인 노력을 기울일 방침이다.


-----------------------------------------------------------------------------------------------------------------------------
[인터뷰]

“빠른 처리 속도와 용이한 접근성이 몽고DB 도입 이유”
이완희 카디날정보기술 사업기획팀장

이완희
Q> 구축된 패턴 분석 시스템은 어떻게 활용될 수 있는가
사용자의 패턴에 맞춘 이벤트 서비스를 제공하는 데 가장 많이 쓰일 것이다. 예를 들어 회사원인 A 씨가 매일 출퇴근 시간대에 자신의 스마트폰으로 버스 도착 여부를 확인한다고 하자. 그럼 사용자 패턴 분석 시스템을 도입한 이동통신사는 A 씨가 검색하는 시간, 이용하는 버스, 해당 버스의 위치정보 등을 분석해 사전 알림 서비스를 제공할 수 있다. 또 20대 여성들이 강남역 주변에서 맛집을 자주 검색한다는 사실에 바탕을 둔 사용자 패턴 데이터를 활용해 오늘의 추천 맛집 알림 서비스나 SNS와 연동된 다양한 서비스를 제공할 수 있다. 이번에 구축한 사용자 패턴 분석 시스템을 LG유플러스가 어떻게 활용할지는 아직 구체화되지 않았지만, 앞서 예로 든 서비스들과 비슷한 형태가 될 것으로 예상한다.


Q> 카산드라 대신 몽고DB를 도입한 이유는 무엇인가
두 데이터베이스의 성능 그래프를 보면, 둘 다 성능이 꾸준히 향상되다가 일정 수준이 되면 그대로 유지되는 것을 알 수 있다. 그러나 카산드라는 전체적인 성능 향상 폭이 큰 반면에, 몽고DB는 성능 그래프의 기울기가 대체로 완만하다. 따라서 몽고DB는 향상된 성능을 유지할 수 있는 기간이 비교적 긴 특성을 지닌다. 또한 카산드라는 페이스북이나 트위터처럼 비정형 데이터의 양이 많은 대규모 웹서비스나 엔터프라이즈 환경에 적합하지만, 몽고DB는 도입 초기에 처리 속도가 빠르고 C 언어로 개발돼 접근성이 우수한 점도 고려됐다. 이번 사용자 패턴 분석 시스템의 경우 프로토타입을 개발하는 것이었으므로 우리는 카산드라보다 몽고DB를 활용하는 것이 비용과 성능 면에서 더 유리하다고 판단하게 됐다.

-----------------------------------------------------------------------------------------------------------------------------




- 마이크로소프트웨어 이병혁 기자 saemosi@imaso.co.kr

- 공개SW 역량프라자

맨 위로
맨 위로