본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

[B2B스타트업] 모두를 위한 기업용 검색엔진, 패스트캣

OSS 게시글 작성 시각 2015-06-22 16:06:46 게시글 조회수 3723

2015년 06월 16일 (화)

ⓒ 블로터닷넷, 이지현 기자 jihyun@bloter.net



검색엔진 기술을 개발하는 기업은 어떤 곳이 있을까? 보통 포털 업체가 떠오르지만 ‘기업용 검색엔진’ 제공하는 기업들도 꽤 있다. 그 중 패스트캣은 2010년부터 기업용 검색엔진 시장에 뛰어든 기업이다. 창업 당시 웹스퀘어드란 회사로 출발했다가 올해부터 사명을 패스트캣으로 바꿨다.


2010년만해도 검색엔진 기술은 국내 많은 기업들이 진출한 레드오션 시장이었다. 송상욱 패스트캣 대표는 검색엔진에 대한 남다른 관심 때문에 자신만의 기업을 설립하고 치열하게 경쟁하고 있다. 최근엔 클라우드 분야까지 진출해 입지를 넓히고 있다.


내부 DB까지 찾아주는 기업용 검색엔진


검색엔진은 두 가지 분야로 나눌 수 있다. 웹 검색엔진과 기업용 검색엔진이다. 웹 검색엔진은 보통 포털에서 사용하는 기술이다. 웹페이지 본문, 웹주소, 제목, 키워드, 메타데이터를 찾고 우선순위로 매겨 결과값을 보여준다. 사용자는 결과값이 나오는 방식을 바꾸지 못한다.


반면 기업용 검색엔진은 웹페이지 뿐만 아니라 내부 데이터베이스까지 검색하는 기술이다. 기업 사용자는 원하는 대로 검색 조건을 정하고 정렬할 수 있다. 단순히 정보를 찾는 것뿐만 아니라 통계도 낸다. 기존 DB 검색 기능은 데이터 양이 많아지면 검색 속도가 느려지고 단어마다 끊어서 검색하지 못한다. 기업용 검색엔진은 언어별 특성을 분석해 조사, 목적어 등 형태소를 분석해 결과값을 내보낸다.


fastcat_03

▲기업용 검색엔진이 작동되는 예(사진 : 패스트캣 홈페이지)


검색엔진을 개발하기 위해선 데이터 분석 기술이 반드시 필요하다. 패스트캣은 검색엔진 기술 뿐 만 아니라 데이터를 모으고 분석하는 기술도 제공하고 있다. 대표적인 게 ‘문서 파일 필터’기술이 있다. 사용자는 문서 파일 필터로 오피스 문서파일, HWP 파일, PDF 등에서 원하는 문자를 추출할 수 있다. 보통 테라바이트(TB)급으로 저장된 문서 데이터를 검색할 때 활용된다. 기업은 문서 파일 필터 기술을 이용하면 데이터를 외부로 노출하지 않고 검색 시스템을 적용할 수는 장점이 있다. 송상욱 패스트캣 대표는 “변호사나 개인 블로거가 등이 문서 파일 필터 기능을 활용한다”라고 설명했다. 패스트캣은 이 밖에도 로그 분석 등에 활용할 수 있는 실시간 빅데이터 분석 기술도 보유하고 있다.


fastcat_04

▲패스트캣이 제공하고 있는 기술(사진:패스트캣 홈페이지)


검색기술 6년차 개발자가 설립한 기업


송상욱 대표는 우연한 기회에 데이터 분석 업체에 입사해 3년간 검색엔진 기술을 접했다. 그 이후 인터넷 쇼핑몰로 이직하고 3년간 다시 검색팀에서 기술을 개발했다. 그렇게 6년 동안 검색기술만 개발하다보니 송상욱 대표는 자신이 직접 만든 검색엔진을 만들고 싶었다. 결국 주말을 반납하며 검색엔진 만드는 일에 매달렸다. 이미 한국에선 검색엔진을 전문적으로 만드는 기업이 꽤 있었다. 한국어를 분석해야 하는 기술 때문에 국내 전문가들이 많이 포진돼 있었다. 송상욱 대표는 “아주 새로운 시장은 아니었지만, 개발자로서 욕심이 났다”라고 설명했다.


“갓 배운 것은 재밌고 계속 하고 싶잖아요. 6년을 검색엔진만 보다보니 이제 제대로 알 것 같았어요. 버리기 아까웠죠. 회사를 설립하면서 2가지 목표를 세웠는데요. 첫 번째는 큰 회사에서 내가 만든 기술을 사용하는 것을 보고 싶었습니다. 두 번째는 나만의 서비스를 만드는 것이었어요. 첫 번째 목표는 달성했습니다. 포털 업계와 쇼핑몰을 제외하고 검색엔진이 필요할 만한 곳에는 패스트캣 기술을 제공했으니까요. 2억건 정도의 상품을 보유하고 있는 웹사이트에도 패스트캣 검색기술이 도입됐고요. 두 번째 목표는 일단 미뤘습니다. 서비스는 투자가 없으면 살아남기 힘들더라고요.”


오픈소스 SW가 가장 큰 무기


패스트캣은 핵심 기술들을 오픈소스 소프트웨어(SW)로 공개했다. 많은 개발자들에게 보여주면서 피드백을 받고 싶었기 때문이다. 그만큼 기술에 대한 자신감이 있었다. 현재 오픈소스 SW는 패스트캣의 큰 무기가 되었다. 송상욱 대표는 “소스코드가 공개되지 않으면 고객은 직접 문제점을 고칠 수 없다”라며 “문제가 발생할 때마다 관련 사업자를 불러야만 한다”라고 설명했다.


fastcat_05

▲패스트캣이 제공하는 핵심 기술은 오픈소스로 공개됐다(사진:패스트캣 깃허브 계정)


사실 검색엔진은 쉬운 기술이 아니다. 많은 고객사가 검색엔진보다 핵심 서비스에 관련된 개발자나 운영자를 두고 있다. 검색엔진에 문제가 생겼을 때 고객이 직접 고치는 경우는 드물다. 대부분 패스트캣 개발자에게 도움을 요청해 기술을 수정한다.


송상욱 대표는 “유지보수를 요청한다 할지라도 고객사는 소스코드를 투명하게 볼 수 있다”라며 “고객들은 기술을 소유할 수 있다는 점을 긍정적으로 평가하고 있다”라고 설명했다. 패스트캣은 유지보수 및 라이선스를 판매해 수익을 얻고 있다. 기본 서비스는 무료로 공개됐지만 한글 분석 플러그인은 유료 서비스로 제공하고 있다.


검색엔진도 이제 SaaS로


검색엔진 기술은 역사가 오래된 만큼 기술이 정체돼 있다. 10년 전만 해도 검색엔진 커뮤니티엔 많은 개발자들이 북적거렸다. 지금은 검색엔진을 다뤘던 많은 개발자가 데이터 마이닝이나 빅데이터 쪽으로 넘어갔다. 송상욱 대표는 “검색엔진을 만들었던 기업들도 사업 방향을 빅데이터로 많이 틀었다”라며 “패스트캣은 초기 개발자가 계속 남아 있고, 검색엔진에 지속적인 투자를 하면서 기술을 계속 업데이트하고 있다”라고 설명했다.


패스트캣을 새로운 전략으로 SaaS(Software as a Service)를 하반기부터 제공할 예정이다. 송상욱 대표는 “작은 규모의 서비스에서 검색이 필요할 때 패스트캣 SaaS를 활용할 수 있다”라며 “SaaS로 수익을 많이 벌기보다는 패스트캣을 외부에 좀 더 알릴 수 있는 도구로 활용할 것”이라고 설명했다. 그는 “비싼 검색엔진을 살 여유가 없는 스타트업같은 작은 기업에 도움이 됐으면 좋겠다”라고 설명했다.


fastcat_01

▲송상욱 패스트캣 대표


오픈소스 기업들이 만드는 한국형 PaaS


최근 국내에서 오픈소스 기술을 개발해 사업을 운영하고 있는 기업들이 모여 OCE(오픈클라우드엔진)라는 연합체를 만들었다. 패스트캣, 유엔진솔루션즈클라우다인한국오픈솔루션이 참여했다. OCE는 한국형 클라우드 PaaS(Platform as a Service)를 공동으로 개발하고 있다. 올해 하반기 출시를 목표로 삼았다. 송상욱 대표는 “기존에 있던 솔루션을 SaaS로 제공하고 싶은 서비스 제공업자에게 운영하기 간편한 한국형 PaaS를 제공할 것”이라며 “클라우드 수요가 늘어나면서 패스트캣의 입지를 넓힐 수 있을 것”라고 기대했다.





※ 본 내용은 (주)블로터 앤 미디어(http://www.bloter.net)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ 블로터 앤 미디어. 무단전재 및 재배포 금지



[원문출처 : http://www.bloter.net/archives/230162]

맨 위로
맨 위로