의료 기업의 난제 '데이터 복잡성'··· 영국 '바빌론 헬스'는 이렇게 풀었다
3월 29일
ⓒ CIO Korea
바빌론 헬스(Babylon Health)는 영국에서 가장 빠르게 성장 중인 의료 스타트업이다. 이 기업의 앱을 이용하면 화상 통화로 국민건강보험(NHS) 보건의(General Practitioner, GP)와 신속하게 연결해 진단 데이터를 확인할 수 있다. 챗봇 방식의 상호작용형 증상 확인 기능도 지원한다.
바빌론은 2013년 알리 파사가 설립한 이후 현재까지 8,000만 달러 이상 투자 받았다. 바빌론, 푸시 닥터(Push Doctor) 같은 앱 덕분에 영국 소비자가 의료 장비에 접근하는 방식이 빠르게 바뀌고 있다. 심지어 보건 장관 매트 핸콕마저 이런 변화를 긍정적으로 평가했다. 단, 의료 업계의 비판도 만만치 않다.
증상 확인 기능과 헬스체크(Healthcheck, 사용자에게 몇 가지 질문을 한 후 건강 보고서를 작성하는 바빌론의 또 다른 서비스)는 기본적으로 대형 의료 데이터베이스와 함께 일련의 알고리즘을 통해 개인화된 추천을 제공한다.
바빌론 헬스는 이런 과정에서 표준 운영 BI부터 더 복잡한 스트리밍 분석, 머신러닝 또는 데이터 사이언스 주도적 사례까지 모든 분석 방법을 사용한다. 이를 지원하기 위해 이 기업은 2017년 10월 네일 윈터스를 비즈니스 인텔리전스 이사로 영입했다. 윈터스는 BBC 월드와이드에서 BI 프로젝트 관리자로 근무한 후 마이크로소프트의 수석 BI 프로젝트 관리자, 애플 EMEA BI 관리자 등을 거쳤다.
윈터스가 화려한 경력에도 불구하고 바빌론 같은 스타트업에 합류한 이유는 무엇일까? 그는 최근 바르셀로나에서 열린 데이터웍스 총회에서 "처음부터 무엇인가를 주도할 좋은 기회였다. 바빌론에서 좋은 점은 기업이 아직 젊기 때문에 레거시 프로세스가 많지 않고 빠르고 현명하며 혁신적인 스타트업의 문화만 있다는 것이다"라고 말했다.
확장 가능한 분석 플랫폼 구축하기
윈터스의 당면 과제는 기업과 함께 안전하게 성장하는 확장 가능한 한 분석 플랫폼을 구축하는 것이었다. 그는 "우리는 매우 큰 기업이 되고자 하는 목표가 있고, 따라서 최대한 혁신적인 기업이 돼야 한다. 그러나 이런 작업에는 안타깝게도 보안, 규정, 감사 가능성, 통제, 유지보수 등 지루한 것들이 수반된다. 이런 요소 중 일부는 오픈소스 솔루션으로 대응할 수 없었다"라고 말했다.
따라서 바빌론은 하둡 같은 기업용 오픈소스 빅데이터 업체인 호튼웍스와 협력하기로 했다. 호튼웍스는 최근 오랜 경쟁사인 클라우데라와 합병 절차를 마쳤다. 윈터스는 "현재 호튼웍스와 클라우데라의 장점은 통합이다. 하나의 계층, 하나의 수집 흐름을 구축해 실제 업무에서 신속하게 태그와 플래그를 처리하고 감사할 수 있으며 단일 뷰로 제어할 수 있다"라고 말했다.
이 시스템은 AWS 클라우드에서 작동하며 모든 수준에서 암호화를 적용해 개인 식별 데이터가 분석에 포함되지 않도록 했고, 익명화 서비스를 통해 보안을 더 강화했다. 윈터스는 "의료 업계의 기업은 전 세계의 여러 규제 당국으로부터 '관심'을 받게 되므로 더 복합적인 보안이 필요하다. 우리는 멋지고 훌륭한 기능이 필요하지만 의료 기업으로 우리가 무엇을 살펴야 하는지도 지속적으로 고민하고 있다"라고 말했다.
그렇다고 해도 호튼웍스와 클라우데라의 합병은 솔루션 선택에 영향을 줄 만큼 큰 요인이다. 윈터스는 "(합병이) 조금은 문제가 될 수도 있을 것 같다. 양사의 툴은 각각 장단점이 있고 그중 더 좋은 것을 선택할 때 양사의 경쟁이 흥미롭기는 할 것이다. 그러나 가장 중요한 것은 미래를 지속적으로 탐구하는 것이다. 특히 우리 기업은 아직 유연하다는 장점이 있다. 만약 우리가 대형 은행이고 지난 10년 동안 일구어 놓은 것이 있다면 걱정이 더 많았을 것이다"라고 말했다.
AI용 플랫폼 구축하기
바빌론은 스타트업이어서 많은 기업이 클라우데라를 통해 해결하는 '페타바이트 규모'의 문제에 직면하지는 않았다. 대신에 가장 큰 문제는 복잡성이다. 데이터의 양보다는 다양성과 속도가 더 고민거리였다. 윈터스는 "많은 영역에서 다양한 데이터가 유입되고 있다. 많은 텍스트 데이터와 함께 다양한 정보의 스트림이 유입될 수 있으며 진단 엔진에도 보이지 않는 링크가 존재하기 때문에 매우 복잡하게 처리된다"라고 말했다.
윈터스는 이런 문제를 해결할 분석 플랫폼을 구축하기 위해 이른바 '서비스 지향적인 아키텍처(service-oriented architecture)'를 도입했다. 이를 위해 모든 분석을 하나의 이벤트로 중앙의 카프카 대기열에 통합해야 했다. 그는 "우리는 바빌론에서 새로운 기능을 활발히 개발하고 있다. 그 이벤트는 어떤 모습일까? 그 정보는 어떤 의미가 있을까? 앞으로 다양한 분석 사용례에서 어떻게 사용되며 소비될까? 우리는 이처럼 다양한 이벤트 모델을 추구하고 있으며, 데이터는 이를 위한 소중한 자산이다"라고 말했다.
이 과정에서 고급 사용자와의 협력관계도 중요하다. 예를 들어 딥 러닝 모델을 개발하는 데이터 사이언티스트가 대표적이다. 윈터스는 "우리가 플랫폼을 통해 엔지니어링 측면에서 가능한 최선을 다해야, 데이터 사이언티스트가 ETL 프로세스를 수행하거나 정보를 조합하는 일 때문에 시간을 낭비하지 않게 된다"라고 말했다.
현재 바빌론은 현재 연구 역량을 더 강화하는 방안을 찾고 있다. 이런 고급 사용자에게 데이터를 효과적으로 제공해 데이터 사이언티스트가 자유롭게 실험할 수 있는 플랫폼을 제공하는 것이다. 윈터스는 "데이터 사이언티스트가 외부에서 수집한 데이터를 이용해 원하는 것을 구축한 후 우리 플랫폼에서 해당 데이터를 실제 데이터와 비교해 자신이 만든 이론 모델이 실제 데이터에도 적용되는지 확인할 수 있다"라고 말했다.
※ 본 내용은 CIO Korea (http://www.ciokorea.com)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ CIO Korea. 무단전재 및 재배포 금지
[원문출처 : http://www.ciokorea.com/news/119891 ]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 435680 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 424610 | 2020-10-27 |
8354 | 블룸버그 "비트코인 후계자 이더리움, 경쟁력 잃고 있다" | 4638 | 2019-03-29 |
8353 | 의료 기업의 난제 '데이터 복잡성'··· 영국 '바빌론 헬스'는 이렇게 풀었다 | 5388 | 2019-03-29 |
8352 | 엘림넷·리눅스데이타시스템, 클라우드 서비스 사업 ‘맞손’ | 4756 | 2019-03-29 |
8351 | 인공지능 미술 시대 막 올랐다 | 5911 | 2019-03-27 |
8350 | 리눅스 재단, 오픈소스 개발자 위한 '커뮤니티브릿지' 플랫폼 출시 | 4340 | 2019-03-27 |
8349 | 가장 보안에 취약한 프로그래밍 언어는 무엇? | 6255 | 2019-03-27 |
8348 | AWS·MS·구글 對 IBM·오라클… `전면전` 구도 | 5151 | 2019-03-25 |
8347 | [이민화의 혁신경제 훈수두기] 플랫폼·인공지능에 올라타라 | 4882 | 2019-03-25 |
8346 | [기고]우수 SW 개발인력 양성을 위한 과제 | 4704 | 2019-03-25 |
8345 | ‘하늘에 떠있는 데이터센터 아니다’ 클라우드 아키텍처 7가지 팁 | 5076 | 2019-03-22 |
0개 댓글