본문 바로가기

Home > 정보마당 > 공개SW 활용 성공사례

공개SW 활용 성공사례

공개SW를 핵심플랫폼으로 구성한 특허조사분석 시스템 개발

특허정보 조사·분석·평가·컨설팅 등 다양한 특허정보서비스를 민간에 제공하고 있는 특허정보진흥센터는 기존 노후화된 윈도우 기반 특허조사분석도구의 운영 유지에 소요되는 높은 비용 부담과 기능 개선을 위해 공개SW 도입을 결정하였다. 리눅스 기반 서버, 검색엔진, 데이터 베이스 등 핵심플랫폼을 공개SW로 구성해 안정적인 성능구현, 비용 절감 효과 외에도 자체 운영에 따른 운영 역량도 향상되었다고 밝혔다. 최근 공공 및 행정분야에 공개SW 도입에 대한 관심이 날로 높아지고 있지만, 특허정보진흥센터는 비교적 이른 시기에 기관 내부에서 자발적으로 공개SW 필요성을 인식하고 외부 기술 조달없이 자체 역량을 활용해 공개SW를 도입한 의미있는 사례로 볼 수 있다.

- 기     관 특허정보진흥센터
- 수행년도 2011년~현재
- 도입배경 특허조사분석도구의 노후화와 특허조사분석의 신규 컨텐츠 개발 및 전문성 강화에 대한 요구 증가에 따라 시스템 재구축 필요
- 솔 루 션 Solr, PostgreSQL, HAProxy, Apache HTTP Server, Tomcat, CentOS
- 도입효과 : 특허조사분석 전문가들의 설계 하에 자체 개발함으로써 시스템의 기능 및 전문성을 강화하였으며, 핵심 플랫폼에 대한 공개SW의 도입으로 예산절감 및 자체 역량 강화

특허정보진흥센터는 국내 최대 규모의 기술분야별 특허전문인력을 바탕으로 특허청의 정책 업무를 지원하는 동시에 특허조사분석, IP컨설팅, 특허평가(KPEG), 상표디자인조사, 국제특허분류(IPC)부여 등 다양한 특허정보서비스를 제공하고 있다. 특히, 특허성(신규성, 진보성) 여부 판단을 위해 출원된 발명과 동일·유사한 종래 기술이 존재하는지 여부를 조사·분석하여 특허청에게 제공하는 선행기술조사를 주요사업으로 하고 있으며, 이를 위해 기술분야별로 약 500여명의 전문 조사인력이 선행기술조사 업무를 수행하고 있다.

 


▲ 한국특허정보원 홈페이지

 

특허조사분석을 위한 전문성을 갖춘 도구 필요

수 백 여명의 전문인력이 전세계의 특허를 조사하기 위해서는 무엇보다 조사도구의 성능이 중요하다. 조사도구는 다양한 컨텐츠 및 사용자 친화적인 UI 등 기능적인 면도 중요하지만, 보다 전문적이고 정확하며 안정적인 특허 조사를 위해서는 검색엔진, 언어분석모듈, 데이터베이스 등의 성능이 매우 중요하다.

 

특허정보진흥센터 정보시스템팀 김명선 선임연구원에 따르면 특허 검색에서의 검색엔진은 포털(네이버, 다음, 구글 등)에서 일반 사용자들이 사용하는 한 두 개의 키워드 입력에 의한 검색이 아닌 여러 개의 키워드를 불리언 연산자(AND, OR, NOT) 또는 근접 연산자(NEAR, ADJ)와 조합하여 입력하는 복잡도 높은 검색식을 처리하여야 한다고 설명했다. 또한, 언어분석모듈의 경우 다른 언어에 비해 비교적 복잡한 분석을 요구하는 한글의 특성상 한글형태소분석의 성능 구현이 무엇보다 중요하다. 그러나 기존에 사용되고 있던 검색엔진 및 언어분석모듈은 품질 향상 요구가 발생하였을 경우 수정 및 업그레이드가 자유롭지 않았으며, 운영환경 또한 Windows 기반으로 운영되어 유지보수 등에 드는 비용이 많은 부담으로 작용됐다.

 

이러한 문제점과 더불어 기존의 노후된 특허조사분석도구를 대체하기 위한 심도있는 검토 끝에 공개SW 도입이 전격 결정되었다. 공개SW의 장점이라면 초기 도입비용이 최소화되는 점도 있겠지만 무엇보다 분야별 최신 기술을 빠르게 적용시켜 볼 수 있다는 것과 전세계 많은 전문가들에 의한 지속적인 성능개선 가능하다는 이점이 있고 또한 사용자의 필요에 따라 커스터마이즈하여 사용할 수 있으며, 이러한 과정들을 통해 해당 기술력을 습득함으로써 기관 자체의 역량 강화에도 도움이 될 것이란 판단으로 프로젝트 진행에 돌입했다.

 

공개SW로 핵심플랫폼 구성...해외 도입사례 참고

새로운 검색시스템의 구축을 위해 먼저 모든 검색서버의 운영체제를 Winodws에서 리눅스 CentOS 기반으로 변경하였다. 리눅스는 이미 수많은 국내외 기업들에서 서버용 OS로 사용되고 있으며, 그 성능 또한 검증이 된 상태였기 때문에 OS 결정에 큰 이견은 없었다는 설명이다. 관건은 검색엔진과 데이터베이스 검색시스템의 성능 구현이 가능한 솔루션을 선정하는 것이 주요 사안이었다. 비공개SW, 공개SW 구분없이 다방면으로 검토하였는데, 특히 구축시 무엇보다 중요하게 고려한 사항은 검색엔진과 데이터베이스의 성능이었다.

 

다방면으로 검토한 결과 검색엔진으로는 Solr를 데이터베이스로는 PostgreSQL을 선정하게 되었다. 사례 및 성능에 대한 자료를 수집하던 2010년 당시에는 두 시스템을 국내에 도입한 사례가 사실상 거의 찾아 볼 수 없었다고 한다. 일부 기업에서 작은 사이즈의 데이터를 처리하는 데 사용되었다는 정보를 접했지만 이 또한 비공식적인 내용이었으며, 공공기관에서는 그 사례가 전무한 상황이었다.

 

이에 반해 해외에서는 유수의 기업들이 Solr 및 PostgreSQL 등을 적극적으로 도입하여 사용하고 있었으며, 서비스 데이터 및 그 대상 또한 엄청난 규모를 다루고 있었다. 이와 더불어 한글분석모듈은 루씬한글분석기(Korlucene)를 도입하였고, 검색시스템 구성을 위해 필요한 Web서버(Apache), WAS(Tomcat), Proxy(HAProxy) 서버 등도 모두 공개SW로 구성하게 된 것이다.

 


▲ 공개SW를 이용한 검색시스템 구성도

 

공개SW 도입으로 안정적인 성능관리 유지

Solr는 설치 및 설정이 간단하고 성능도 매우 뛰어나다. 무엇보다 Solr를 선정하게 된 이유는 다음 세 가지를 들 수 있다.

 

첫째는 다양한 검색유형을 만족시키기 위한 사용자 정의 Filter 및 Analyzer, Query Parser의 적용이 간편하다. 특허에는 번호정보와 같이 특정한 형식을 지닌 데이터들이 존재하며, 특정 목적에 맞는 검색을 위해서는 그에 알맞은 필터 작성이 요구되는데 Solr에서는 비교적 쉽고 간단하게 적용할 수 있기 때문이다.

 

둘째는 다양한 국가의 언어분석모듈을 지원한다는 것이다. 현재 사내에 서비스 중인 특허검색시스템에서는 한글, 영어, 일어에 대한 검색을 지원하고 있으며, 향후 중국어 등 보다 다양한 언어의 특허검색 서비스도 검토하고 있다. 이러한 요구에 맞게 Solr에는 이미 다양한 국가의 언어분석모듈이 포함되어 있으며, 한글분석기 또한 최근에 Apache Lucene 프로젝트에 공식 포함되어 기여하고 있어 안정된 성능 관리가 유지되고 있기도 하다.

 

셋째는 뛰어난 분산처리 능력이다. 특허검색 서비스는 세계 주요국가의 특허를 검색의 대상으로 하기 때문에 색인되는 특허의 개수도 많지만 특허 명세서의 특성상 문서 하나당 데이터양도 매우 방대하다. 이렇게 방대한 양의 데이터를 원활하게 서비스하기 위해서는 반드시 분산처리(distributed search)가 요구되는데, Solr에서 제공하는 분산처리는 성능도 우수하지만 최근 버전에서 지원되는 Solr Cloud 기능을 사용하면 장애허용(fault tolerant)을 지원하는 등 안정성에 있어서도 만족할 만한 결과를 보여주고 있다.

 

특허데이터의 적재·운영에 사용하고 있는 PostgreSQL 또한 해외에서 상당히 인지도가 높은 공개SW 중 하나이며, 수많은 레퍼런스 및 온∙오프라인 커뮤니티 등을 통해 정보 습득이 용이한 편이다. PostgreSQL은 단순한 데이터의 적재·운영에만 사용되는 것이 아니라 특허데이터의 정량적 통계 및 분석을 도출하는데 적극 사용되고 있으며, 이를 위한 테이블피벗 기능이 다른 데이터베이스 솔루션에 비해 용이한 편이다. 또한 다양한 프로시져 언어 지원을 통해 데이터 관리에 있어 복잡성이 요구되는 작업들을 효율적으로 처리할 수 있게 도와준다. 향후에는 PostgreSQL 운영을 통해 입증된 성능을 바탕으로 공개SW 데이터베이스 적용범위를 확장시켜 나갈 계획이다.

 

다양한 공개SW 도입 및 커스터마이즈를 통해 2011년 하반기부터 새로운 특허조사분석도구를 사내 서비스로 오픈하게 되었으며, 2013년 하반기부터는 상표디자인조사 시스템 영역으로 확장하여 서비스하는 등 사내 핵심 업무 시스템의 공개SW 전환을 지속하고 있다.



[인터뷰]


다양한 해외 공개SW 활용사례 참고 및 공개SW 커뮤니티 도움 얻어

특허정보진흥센터 정보시스템팀 김명선 선임


특허정보진흥센터 김명선 선임
▲ 특허정보진흥센터 김명선 선임

Q> 공개SW 도입에 관심을 가지게 된 계기가 있나?

기존 특허조사분석도구의 노후와 새로운 기능 및 성능 향상에 대한 요구로 인해 신규 시스템을 계획하게 되었고, 시스템의 특수성을 고려하여 자체 개발 쪽으로 의견이 모아졌다. 하지만 초기 개발비 및 유지보수 비용은 여전히 부담으로 작용되었으며, 검색엔진, 데이터베이스, 운영체제 등 핵심이 되는 플랫폼의 도입비용이 저렴하면서, 상대적으로 안정성이 검증되고, 최신의 기술을 사용할 수 있는 공개SW로 선정하게 되었다.

 

Q> 공개SW를 도입 전 고려사항은?

공개SW 도입시 가장 고민이 되는 부분이 안정성과 기술지원이 아닌가 생각한다. 우리 기관에서도 공개SW를 도입을 한창 고려중일 때 이 두 가지 사항에 가장 주안점을 두고 고민을 거듭했다. 도입 고려 시점에 참고할만한 유사 기관 사례가 거의 없었으나 반대로 해외의 Solr, PostgreSQL, CentOS 등의 다양한 활용 사례를 참고해 안정성을 어느정도 신뢰할 수 있게 되었고, 사용자 커뮤니티 또한 활발하게 진행되고 있어 문제 발생시 일부 기술지원도 가능할 것으로 판단했다. 개발초기부터 관련 공개SW 커뮤니티를 통해서 도움을 받은 경험이 있어서 공개SW에 대한 편견을 일찍이 해소한 것 또한 프로젝트를 원활하게 진행할 수 있었던 동기로 작용했다고 생각한다.




- 공개SW 역량프라자
맨 위로
맨 위로