본문 바로가기

Home > 정보마당 > 공개SW 활용 성공사례

공개SW 활용 성공사례

[공개SW 활용 성공사례 176] 다나와 - 공개SW 통해 가격비교를 넘어 가치비교 제공

OSS 게시글 작성 시각 2015-03-06 14:48:05 게시글 조회수 5333

가격 비교 사이트의 ‘강자’


인터넷 가격비교 사이트로 유명한 ‘다나와’는 단순 가격비교를 넘어 소비자들에게 가치비교를 제공하고자 노력하고 있다. 이를 위해 상품에 관한 자세한 정보와 옵션별 상품정보 검색, 특히 모든 상품을 찾을 수 있는 통합검색 서비스를 제공하고 있다. 이러한 다나와의 서비스가 가능할 수 있도록 한데는 공개SW의 힘이 컸다. 공개SW 기반의 검색엔진 솔루션과 다양한 공개SW를 적극적으로 활용했기 때문이다.

- 기     관 다나와
- 수행년도 2014년
- 도입배경 일반화된 검색엔진과 SW만으로는 가치비교를 위한 커스터마이징된 검색 서비스 필요성 제기, 라이선스 비용 부담 등
- 솔 루 션 CentOS, Apache http server, 패스트캣서치(fastcatsearch), MySQL
- 도입효과 : 공개SW를 활용해 비용절감, 벤더종속성 탈피, 시스템 구축 유연성 확보

언젠가부터 우리는 물건을 사기 전 인터넷으로 가격을 비교해 본 후 그 중 가장 저렴한 곳에서 온라인 결제를 한 뒤 물건을 배송시킨다. 이 같은 일이 가능해 진 것은 바로 가격비교 사이트가 등장하고 보편화되면서 부터다. 이제 전자상거래 시장에서 가격비교 사이트의 영향력은 막대하다.
다나와는 국내 가격비교 사이트 중 가장 대표적인 곳으로 ▲다나와 자동차 ▲다나와 이벤트 ▲다나와 조립PC ▲다나와 텔레콤 ▲다나와 장터 ▲다나와 커뮤니티 ▲다나와 리서치 ▲다나와 앱 서비스 등 다양한 서비스를 제공하고 있다.




▲ 다나와 메인화면


다나와의 이 같은 서비스 변화는 가격비교서비스 산업의 성장에 따른 것이다. 과거 가격비교 서비스 산업이 성장하면서 경쟁업체들의 진출도 눈에 띠게 늘어났다. 기존 가격비교 경쟁업체 외에도 주요 포털에서도 비슷한 서비스를 선보였다. 2010년에는 이베이옥션 ‘어바웃’이 런칭됐으며, 여기에 소셜 네트워크 서비스(SNS)를 기반으로 한 전자상거래 서비스인 ‘소셜커머스’도 우후죽순 생겨났다. 이 같은 경쟁 속에서 다나와의 선택은 다양한 서비스를 통한 경쟁력 강화로 종합쇼핑 포털로 거듭나야 한다는 것이었다.


정성호 다나와 기업부설연구소 연구1팀 실장은 “양질의 쇼핑정보를 제공해 소비자의 구매결정을 돕고 다양한 커뮤니티를 통해 소비자로 하여금 자발적으로 정보와 토론의 장을 형성하게 할 뿐 아니라 쇼핑 컨텐츠와 서비스로 소비자를 만족시키는 것이 가격비교 사이트의 본질”이라며 “가격비교를 중심으로 다양한 컨텐츠와 커뮤니티를 구축하고 사업 다각화를 통해 경쟁력을 키우고 있다”고 설명했다.



공개SW기반 검색엔진 도입, 검색을 통한 다양한 볼거리 제공


하지만 다양한 서비스 제공만으로는 고객을 만족시킬 순 없다. 가격비교 사이트 업체 입장에서 가장 중요한 경쟁력은 검색을 통한 다양한 볼거리를 제공해야만 한다는 점이다. 다나와 역시 이 점을 잘 알고 있었다. 때문에 다른 경쟁사와는 차별화할 수 있는 검색과 결과가 필요했다. 이를 위해 다나와는 공개SW 기반의 검색엔진 솔루션 ‘패스트캣서치(FastCatSearch, 이하 패스트캣)’를 도입했다.



▲ 검색 시 연관성이 없는 단어는 자동으로 삭제한 후 화면에 보여준다


패스트캣은 국내 대표적인 공개SW 기반의 검색엔진 개발사인 패스트캣(구.웹스퀘어드)가 개발한 검색엔진 솔루션이다. 패스트캣은 검색어에 대한 형태소 분석을 통해 사용자가 원하는 검색 결과를 출력하며 고속색인 압축을 통해 검사 속도도 높인 것이 특징이다. 특히 이러한 장점을 통해 정부로부터 GS(굿소프트웨어)인증을 받으며 성능을 인정받기도 했다.



공개SW 기반의 빠른 검색엔진 ‘패스트캣서치’


패스트캣은 자바를 기반으로 개발됐다. 이는 자바가 공개SW이기 때문에 JVM이 존재하는 시스템에서는 어디서든 안정적으로 동작하고 C++로 작성된 솔루션보다 장애 대처와 유연한 메모리 관리 측면에서 더 유리하기 때문이다. 특히 C언어로 짜여질 경우 이해하기가 어려울뿐더러 사용자들에게 크게 도움이 되지 않는다는 단점이 존재한다.


특히 패스트캣의 장점은 검색속도와 정확도다. 이를 위해 색인파일과 문서를 고속으로 압축하고 해제할 수 있는 알고리즘을 사용했다. 이를 통해 디스크 IO를 최소화하고 빠른 검색이 가능하다는 것이 회사측의 설명이다. 또 색인파일이 원문대비 70% 크기로 생성돼 디스크 용량 부담을 저하시켰다.


뿐만 아니라 데이터소스의 변경사항만을 색인하는 동적 색인 지원과 서비스를 멈추지 않고 데이터 소스의 변경 사항을 실시간으로 검색결과에 반영할 수 있도록 했을 뿐 아니라 멀티쓰레딩 병렬 처리를 사용해 서비스에 영향을 주지 않고 색인 작업이 가능하도록 했다.


이 외에도 한글분석기를 내장해 한글 검색어 처리를 가능토록 했고 자체 개발한 한글형태소 분석기와 고품질의 사전을 통한 검색, 신조어, 금칙어, 유사어 확장 기능을 담았다. 또 외장 한글분석기도 사용이 가능해 확장성이 우수하다.


사용자 편의성도 향상시켰다. 첨부파일 검색 기능은 물론 사전관리 기능, 복원기능을 추가해 장애 발생시 즉각적인 처리가 가능토록 했다.


사실 패스트캣 성능의 완성도를 높이는 데는 다나와가 많은 기여를 했다는 평가를 받고 있다. 패스트캣 v1이 릴리즈되던 2012년부터 다나와 시스템에 적용해 테스트를 진행해 왔다.


정 팀장은 “패스트캣 v1, v2를 각각 1년간 검증 테스트를 했었다”며 “실제 다나와 사이트에 적용하기 위한 프로젝트는 2013년 10월부터 시작해 2014년 6월 본격적으로 오픈에 들어갔다”고 설명했다.



커스터마이징, 유지보수, 라이선스 비용 측면에서 공개SW가 유리


그렇다면 왜 공개SW기반의 검색엔진일까. 이 점에 대해 정 팀장은 “상용화된 기존의 검색엔진으로는 다나와에서 요구하는 사항을 충족시킬 수 없기 때문”이라고 설명했다. 그의 설명에 따르면, 가격비교 산업 성장에 따라 제휴되는 쇼핑몰이 늘어나고, 가격비교 상품의 종류 역시 기하급수적으로 증가함에 따라 가격 비교 시스템도 꾸준한 개선이 필요한 상황이 발생했다. 특히 판매사에서 등록된 상품명을 기반으로 검색해야 하는 상황에서 맞춤법, 띄어쓰기 등의 정제되지 않은 자료를 바탕으로 빠르고, 정확하게 검색해야 할 필요성이 발생할 수밖에 없었다.


그럼에도 기존의 일반화된 검색엔진으로는 가격비교를 위한 커스터마이징이 쉽지 않다. 또 솔루션 업체에게 비용을 들여 회사 특성에 맞도록 변경하더라도 구축 비용이 고가일 뿐 아니라 제약된 범위에서 구축될 가능성이 크며, 향후 특화된 솔루션에 대한 유지보수도 기대하기 어렵게 마련이다.


정 실장은 “지난 10여년간 상용 검색엔진을 도입해 사용해 왔지만, 상품 검색이라는 특수 분야에서 제대로 성능을 발휘하기가 힘들었다”고 설명했다. 그는 이어 “입력된 검색어 이외에도 다나와가 보유하고 있는 각종 정보들, 카테고리, 제조사 등을 활용하여 여러 유사한 상품들을 검색결과로 제공하고 내부 규칙에 의한 랭킹 로직을 개발해 차별화를 꾀했다”고 강조했다.


그 결과 신규 통합검색시스템 구축 및 키워드 운영 등을 통하여 검색 정확도가 향상됐다. 이는 곧 가격비교 서비스 외에도 상품관련 기사나 상품 후기 등 다양한 볼거리를 원하는 방문객이 많고, 이들의 요구를 검색을 통해 잘 보여주고 있으며, 이는 곧 고객들의 충성도로 이어졌다는 해석이 가능하다.



▲ 검색어를 입력하면 검색 추천 상품이 보여진다




▲ 다나와 시스템 구성도



[인터뷰]


“공개SW는 여러 아이디어가 모여 다양한 케이스 만들어”


정성호 다나와 기업부설연구소 연구1팀 실장


정성호 다나와 기업부설연구소 연구1팀 실장

공개SW의 장점은 무엇이라고 보는가

공개SW는 여러 아이디어가 모여 다양한 케이스를 만들 수 있다는 점이다. 특히 이는 공개SW 커뮤니티에서 확인할 수 있다. 커뮤니티를 들여다보면, 공개SW에 대한 수 많은 질문과 오류에 대한 수정 등이 공개돼 있고, 이게 바로 날리지(지식, 정보)가 된다. 하지만 상용은 공급업체에게만 질문할 수 있고, 한정된 답밖에는 구할 수 없다.


특히 공개SW는 커스터마이징이 유연하다는 점이다. 상용의 경우는 소스코드를 손보거나 유수보수에 비용 부담이 있다.



공개SW 기반의 검색엔진을 도입했는데, 상용과 비교한다면?

사실 공개SW를 도입했다고 100% 성공을 보장하기는 어렵지만 상용SW와 성능면에서 비슷한 퍼포먼스를 구현할 수 있다고 생각한다. 그간 운영팀에서 경험한 노하우를 검색 로직에 반영할 수 있었기 때문에 정확도 등의 향상이 있었으며, 또한 비용도 절감할 수 있었다. 예를 들어, 국내 한 대표적인 오픈마켓의 경우, 상용 검색엔진 업체로부터 사이트 라이선스와 소스코드를 구입한 바 있다. 첫 구매 시에는 10억원이 들었다. 그 후 업그레이드 된 소스코드와 사이트 라이선스 구매 때는 100억원의 견적 요청이 있었다고 한다.


실제 다나와가 패스트캣과 상용검색엔진 도입 비용을 검토한 결과에서도 소스코드, 사이트 라이선스를 빼고도 많은 부분 절감효과가 발생했다.




- 공개SW 역량프라자
맨 위로
맨 위로