Home > 정보마당 > 공개SW 활용 성공사례

공개SW 활용 성공사례

공개SW 일체로 링크드 데이터 구현…공공의 가치 창출한 데이터 활용 사례로서 주목

서울특별시(이하 서울시)는 공공정보의 개방을 통해 새로운 서비스와 공공의 가치를 창출하고자 하는 ‘열린시정 2.0’의 일환으로 서울 열린 데이터 광장 내에 링크드 데이터 시범 서비스를 구축했다. RelFinder, Exhibit 2.0 등의 공개SW들로 구성된 링크드 데이터 시범 서비스는 공공의 가치를 창출한 데이터 활용 사례로서 주목받고 있다. 데이터 간의 관계를 정의해 데이터 간 연결성이 강화되고 데이터 정제를 통해 데이터 품질이 향상되는 등의 링크드 데이터의 기술 구현에 공개SW가 큰 도움이 된 것으로 평가된다.

- 기     관 서울특별시
- 수행년도 2013년
- 도입배경 기관별 상이한 포맷으로 인한 탐색과 재사용상의 어려움 해소
- 솔 루 션 RelFinder, Exhibit 2.0, Pubby, LodLive, Google Refine, MySQL
- 도입효과 : 개별 데이터셋과 외부 데이터 연결을 통해 데이터 표현력 향상, 열린 데이터셋의 의미적 연결 관계 구축, 데이터 접근성 향상, 적은 예산으로 단기간 내에 서비스 구축, 웹 표준 준수를 통한 확장성 있는 서비스 지원

서울시 로고

서울시는 공공정보의 개방을 통해 소통함으로써 공익성과 업무효율성을 높이고 시정 투명성을 확보할 방안을 모색해왔다. 이에 따라 형식적인 정보공개 관행, 공공정보에 대한 가치 인식과 시민 주권의식 부족 등과 같은 그간 추진해온 열린시정에 대한 각계각층의 의견을 수렴한 서울시는 세계적인 추세인 거버먼트 2.0(Government 2.0)에 동참하고자 개방·공유·소통의 열린시정 2.0을 추진키로 결정했다. 이를 위해 서울시 산하기관과 지자체의 정보유형과 공개현황 분석을 토대로 열린시정 2.0에 대한 종합계획과 세부과제를 수립했고, 그 결과로 공공정보의 개방을 넘어 새로운 가치 창출을 목표로 한 국제 표준 기반의 오픈플랫폼인 ‘서울 열린 데이터 광장’이 오픈됐다.


Open Knowledge Foundation logo

열린시정 2.0 실현할 오픈플랫폼, 서울 열린 데이터 광장

서울 열린 데이터 광장은 사회·경제적으로 가치가 높은 공공정보를 개방함으로써 다양한 비즈니스 기회를 창출하고 IT 콘텐츠 산업 육성에 기여하는 데 그 목적이 있다. 이에 따라 교통, 환경, 도시관리 등 10개 분야 72종 1,600여 개의 데이터가 OpenAPI, Sheet, Chart, Map, File, Link 형태로 민간에 개방됐다. 경제적 가치가 높은 공공정보 활용을 장려하기 위해 서울시는 스마트 앱 개발 공모, 공공정보 활용을 위한 민간 캠프 지원, 개발자 커뮤니티 운영 등을 추진했고, 이러한 노력은 실시간 위치 기반의 대중교통정보, 도서관좌석정보, 실종아동찾기, 행정용어사전, 기상청 날씨, 유가정보, 서울시전통시장 등의 모바일 앱이 개발되는 성과로 이어졌다. 삶의 질을 높이는 데 기여한 서울 열린 데이터 광장은 공공기관 혁신 사례에서의 의미 있는 전환점이 됐을 뿐 아니라 그 경제적 가치만 2조1,000억 원으로 평가되고 있다.


서울 열린 데이터 광장 웹사이트
▲서울 열린 데이터 광장 웹사이트


오픈데이터 진화 링크드 데이터

공공정보의 개방과 공유로 새로운 가치를 창출하려는 서울시의 노력은 서울 열린 데이터 광장을 통해 개방돼온 가공되지 않은 RAW 데이터에 대한 고민으로 이어졌다. 개방된 공공문서의 포맷이 달라 데이터의 탐색과 재사용이 어려울 뿐 아니라 민간에서 자체적으로 가공한 데이터의 공유도 쉽지 않은 등 RAW 데이터의 구조적 한계가 꾸준히 대두됐다. 이에 서울시는 RDF(Resource Description Framework)로 문서 포맷을 표준화하고 데이터의 정제와 구조화를 통해 데이터 간의 관계를 정의하는 링크드 데이터 기술을 도입키로 결정했다. 서울 열린 데이터 광장의 구축에 참여한 김학래 OKFN Korea(Open Knowledge Foundation Korea) 리더는 “개방·공유·소통의 진정한 의미는 데이터에서 공공의 가치를 창출하는 데 있다”며 “이를 위해서는 RAW 데이터를 다양하게 활용할 수 있는 기술적 뒷받침이 필요하다”고 링크드 데이터 기술의 도입 배경을 설명했다. 또한 기술적 한계로 정보 개방에만 편중됐던 RAW 데이터에 대한 새로운 기술적 접근 방식을 통해 공공기관과 민간에서 참고할 만한 롤모델을 제시할 수 있다는 점도 고려됐다고 김학래 리더는 덧붙였다.

모든 데이터를 URI(uniform resource identifier)란 고유의 이름과 RDF 형식으로 정의한 일종의 시맨틱 웹 기술인 링크드 데이터는 데이터 간의 관계를 정의하고 데이터셋에 포함된 개별 데이터까지도 탐색할 수 있을 뿐 아니라 데이터 정제를 통해 품질을 높이고 데이터 간의 연결성을 향상시킬 수 있어 차세대 모델로서 주목받고 있다.


링크드 데이터 시범 서비스 구조
▲링크드 데이터 시범 서비스 구조


공개SW 일체로 링크드 데이터 시범 서비스 구현

서울시는 RDF로 표현된 데이터를 탐색할 수 있는 ‘시맨틱 질의&검색’, 데이터 간의 관계를 시각적으로 표현하는 ‘시맨틱 관계 탐색’, 데이터의 구조적 특징을 알지 못해도 링크드 데이터 간 효과적인 탐색을 돕는 ‘패킷 내비게이션’으로 링크드 데이터 시범 서비스의 기능을 세분화했다. 구글, 마이크로소프트, 야후가 협력한 schema.org 모델의 온톨리지 속성을 확장하는 형태의 표준 모델을 개발한 서울시는 이를 통해 시가 보유한 600여 종의 문화시설 데이터와 문화재청의 1만3,000여 종의 국보, 보물, 유무형문화재 및 안전행정부의 2만여 개 행정구역 데이터를 링크드 데이터 서비스를 위한 표준 포맷인 RDF로 변환했다.


RelFinder logo


또한 RDF를 탐색하기 위해 공개SW인 Exhibit 2.0을 도입하면서 RelFinder로 데이터 간의 관계를 시각화했으며, 리소스 제약으로 인해 대용량 처리에 취약한 Exhibit 2.0의 문제를 개선하기 위해 데이터가 최적의 크기로 분산 처리되도록 커스터마이징했다. 이밖에도 웹브라우저에서 RDF를 탐색하기 위한 Pubby, 데이터 간의 관계를 동적으로 탐색하는 LodLive, 데이터를 정제하고 링크드 데이터를 구축하기 위한 Google Refine 등의 공개SW를 활용한 덕분에 사용자 중심의 링크드 데이터 시범 서비스를 단기간 내에 구축할 수 있었다.

김학래 리더는 “링크드 데이터에 대한 기술적 접근보단 이를 통해 새로운 가치 창출이 가능토록 사용자 중심의 서비스를 구현하는 데 공개SW 도움이 컸다”며 핵심 기능을 공개SW로 구현함으로써 핵심 영역에 개발역량을 집중할 수 있었을 뿐 아니라 향후 개발 성과를 민간과 공유하는 데에도 한층 유리했다고 설명했다. 이렇게 구축된 링크드 데이터 시범 서비스는 사용자의 질의를 SPARQL 언어로 처리하거나 SPARQL Endpoint로 데이터의 관계를 표현할 수 있다. 따라서 링크드 데이터 시범 서비스의 시맨틱 질의&검색에 “서울시가 보유한 문화시설은?”을 검색하면 그 의미를 인식하고 위치와 이용방법을 비롯한 문화시설에 대한 기본 정보와 소장한 국보에 대한 세부 정보까지 검색된다. 또한 시맨틱 관계 탐색 서비스에서 ‘서울시’와 ‘소공동’을 입력하면 두 키워드의 공통 특성인 ‘중구’는 물론 상하위 구역의 관계를 시각적으로 보여주는 등 개별 데이터셋과 외부 데이터 연결을 통해 데이터 표현력을 향상시키고 웹 표준 기반의 열린 데이터셋의 의미적 연결 관계를 성공적으로 구축한 것으로 평가되고 있다.



▲시맨틱 질의&검색 서비스

▲시맨틱 관계 탐색


▲패킷 내비게이션


공개SW로 일체가 구성된 링크드 데이터 시범 서비스를 성공적으로 구축한 서울시는 시군 단위로 행정구역을 확대하고 도로명, 우편번호 등 시민 생활과 밀접한 영역을 추가할 계획이다. 또한 온톨로지 스키마를 고도화하고 파편화돼 있는 Raw 데이터를 링크드 데이터로 전환할 뜻도 내비쳤다. 또한 서울시는 ‘International Open Data Day’를 후원하는 등 열린 데이터 광장과 서울시 공공 데이터의 활용성을 증진시키기 위한 노력도 이어나가고 있다.


[인터뷰]


“정보의 개방과 공개SW 모두 소통과 참여가 핵심”

김학래 OKFN Korea 리더


Q> 공공기관을 중심으로 정보의 개방이 화두다

세계 각국이 정부 주도로 공공 정보의 개방을 위한 제도적 지원을 마련하고 데이터 개방을 위한 포털 플랫폼 구축에 적극 나서고 있다. 이에 대한민국 정부도 데이터의 중요성을 인지하고 준비에 박차를 가하고 있다. 정보의 개방은 정부 운영의 투명성을 확보할 수 있는 수단이다. 하지만 단지 정보의 개방에만 치중한다면 데이터에서 공공의 가치를 창출한다는 거버먼트 2.0의 의미가 퇴색될 뿐 아니라 전시행정이란 비판을 받은 과거의 오류를 반복할 우려가 있다. 그러므로 정보의 개방은 솔루션이나 기술 중심이 아닌 이용자 중심의 서비스가 될 수 있도록 명확한 기준과 목표를 가지고 추진해야 한다.


Q> 공개SW에 대한 국내 인식이 부족한데…

공개SW를 도입했음에도 이를 명시하지 않아 곤욕을 치룬 기업 사례는 어렵지 않게 찾을 수 있다. 이런 문화도 한편으로는 직접 개발한 코드만을 실력이나 성과로 인정하는 NIH 신드롬(조직 내부 역량만 받아들이는 배타적 태도)과 같은 그릇된 기업 문화에서 원인을 찾을 수 있지 않을까?
또한 공개SW 프로젝트에 기여하는 문화가 조성돼야 한다. 공개SW에 참여하지 않고 이용만 한다면 단순한 소비자로 남게 될 뿐이다. 누군가가 이미 경험한 문제를 또 다른 누군가가 경험하는 악순환이 반복되는데, 그 누군가가 바로 당신일 수 있다. 그러므로 공개SW를 완성된 솔루션 관점에서만 보지 말고 발전 가능성이 높은 프로젝트란 관점에서 도입해 활동하고, 공개SW 프로젝트에 참여하는 인식의 변화가 필요하다.




- 마이크로소프트웨어 조수현 기자 suhyeoni@imaso.co.kr

- 공개SW 역량프라자
맨 위로
맨 위로