본문 바로가기

[기고] 의료 AI 오픈소스 현황과 혁신

support 게시글 작성 시각 2022-08-30 10:12:40

 

의료 AI 오픈소스 현황과 혁신

 

차의과학대학교 AI보건의료학부 배장표 조교수

 

1. 의료 인공지능의 오픈소스 상황

 

오픈 소스의 경우 데이터 부분에서의 오픈과 시스템의 핵심 코드를 오픈하는 두가지로 구분할 수 있다. 우선 데이터 부분의 공개에 대해서 살펴보고 코드의 공개에 대한 이야기를 하도록 하겠다. 해외의 경우 필자가 아는 선에서, 해외와 국내 사례를 살펴본다. 해외의 경우 두가지 중요한 의료 데이터 공개를 확인할 수 있다. 영국의 스코트랜드에서 공개한 BIOBANK 라든지 미국의 스탠포드 대학에서 공개한 인공지능의학&이미지센터(AIMI) 등에서 다량의 의료데이터를 대중에게 공개를 한 사례를 찾을 수 있었다. 이러한 시스템의 데이터를 활용해서 출판되는 논문의 수는 상당한 것으로 보여진다. 국내에서는 ‘디지털 뉴딜’ 핵심프로젝트인 ‘데이터 댐’의 대표사업으로 인공지능 서비스 개발에 필수적인 학습용 데이터를 대규모로 구축·개방하는 사업을 최근에 정부 주도로 시행했고 AI허브를 통해서 2021년 6월 총 170종(4억 8000만건)을 공개하였다(아래 포함된 그림). 2022년 7월에는 AI 학습용 데이터 190종(5억 8000만 건)을 추가로 공개하였다. AI허브를 방문해 헬스케어 데이터의 질을 살펴 보았을 때, 실질적인 사업으로 연결시킬 수 있는 다량의 데이터가 공개되어 있다. 하지만 이러한 현재 공개된 헬스케어 데이터 51종의 경우 의사가 다루는 질환을 전체적으로 다루는 것은 아니고, 사업화가 가능한 새로운 시스템은 영상의학 의사들의 자문을 구해서 병원에 쌓인 데이터를 새롭게 발굴하는 것이 필수적이어 보이는 것이 사실이다. 병원에 쌓인 데이터 자체를 공개하는 것은 아니기 때문에 발생하는 현실이다.

 

 

Industrie4.0
 

인공지능 오픈소스에 대해서 이야기 하자면, 2016년 구글이 tensorflow를 공개하기 전까지는 일반인이 딥러닝 신경망을 활용한 인공지능 시스템을 직접 활용하기는 가능하지 않았다. 표1에서 주요 병리영상 관련 인공지능 의료기기 허가 현황이 제시되어 있다. 2022년 5월 4일 식품의약품안전처로부터 제출받은 인공지능 기반 의료기기 허가 현황 자료에 따르면, 2022년 4월 기준으로 뷰노의 골연령 판단 영상분석 소프트웨어부터 메디컬아이피의 장기 분할 소프트웨어까지 110개 품목이 허가를 받았다. 루닛과 뷰노와 같이 현재 의료 인공지능을 이끌고 있는 의료 인공지능 회사들은 신경망을 이전부터 연구해 왔던 부분을 직접 상용화 하여 진단 시스템을 만들고 이를 상용화 하는 형태로 시작하였다. 한국이 가진 인공지능 역량이 부족해서 이러한 코드를 tensorflow와 같은 시스템으로 발전시키지 못하는 것은 안타까운 일이다. 한국에서 주도해서 소프트웨어 생태계를 꾸미는 것이 어려운 것은 소프트웨어가 영어권이 주도하는 부분인 것이 대다수이기 때문이다. 

병리영상 관련 주요 인공지능 의료기기 허가 현황

출처: 식품의약품 안전처

 

사용된 자체적인 의료 인공지능 framework 자체가 공개되어 글로벌화 되면 좋겠지만, 부수적으로 다양한 학술 논문으로 한국의 많은 인공지능 진단회사들은 대중에게 회사의 기술을 공개하는 형태를 띄고 있는 것으로 보인다. 최근에 2021년 RSNA에 참가한 국내 의료 AI 기업은 약 14곳이고 작년에는 절반인 7곳이다. 루닛은 자사 AI 솔루션에 대해 진행한 연구 초록 13개를 이번 RSNA에서 발표했다. 루닛이 올해 RSNA에 발표하는 13개 연구 초록 중 3개는 신제품인 루닛 인사이트 DBT 관련 내용이었다. 이러한 연구활동들을 통해서 해외에 한국의 의료 인공지능 시스템을 소개하고 공개하는 방식을 주로 취하고 있다. 눈에 띄는 저널 논문으로, 아산병원의 김남국 교수 연구팀이 공개한 논문을 언급할 수 있다. 필자도 해당 연구팀에서 연구를 4년간 박사과정중에 수행했는데, 해당 논문은 직접 학습한 의료의 여러가지 시스템을 공개한 것으로 소스코드 외에 진단에 직접 활용될 수 있는 신경망 파라미터 정보까지 포함하고 있다. 해당 시스템을 활용하여 해외의 연구자들도 한국의 의료진단 부분의 기술에 접근을 할 수 있다. 이러한 형태로 루닛이나 뷰노도 자신의 신경망 학습한 것을 공개하면 좋겠지만, 이러한 신경망 학습 시스템 자체가 이윤으로 연결되는 형태이기 때문에 이런 형태의 공개는 하지 않은 것으로 보인다. 교통 안내 네비게이션과 같은 기술은 초반에 해당 기술로 수익을 거두려고 시작했지만 현재는 대부분 공개로 전환되어서 사용되고 있다. 사람들의 일상 생활에 직접적으로 연계된 기술이기 때문에 공개를 유지하는 부분이 있다. 의료진단 소프트웨어의 경우 한번 학습한 시스템이 수만명의 진단을 반복적으로 수행할 수 있기 때문에 이와 같은 기술에 대해서는 인류와 의료의 저렴화를 위해서 공개가 필요해 보이지만, 현재는 지속적인 개발이 유지되어야 하기 때문에 다른 행태를 보여 준다고 생각한다.

 

2. 전통적 의미에서 인공지능 시스템의 한계점

 

앤드루 매카피 MIT 교수는 인공지능을 탑재한 기계와 인간이 어떻게 경쟁할 것인가라는 물음에 다음과 같이 답했다. "인간이 기술을 제대로 이해하고 활용하면, 기술 자체보다 더 큰 힘을 만들어 낼 수 있습니다. 기계가 못 하는 활동에는 한 가지 공통점이 있습니다. 바로 아이디어 떠올리기(ideation), 즉 훌륭하고 새로운 아이디어나 개념을 떠올리는 행동입니다. 앞으로 세계는 기술을 제대로 활용할 줄 알고, 이를 통해 참신한 전략을 짤 수 있는 인재들이 지배할 것입니다.“ 이러한 아이디어 떠올리기는 성리학의 이기론(理氣論)에서 이(理)를 세우는 행위로도 해석할 수 있다. 1500년대의 우리의 선조들은 이러한 이(理)를 세우는 일을 사람의 마음에서 일어나는 사고의 중요한 매커니즘(mechanism)으로써 생각하고 많은 이론들을 구축하였다. 신경망 기반 인공지능 시스템은 약인공지능 시스템을 기준으로 많은 발전이 있었다. 약인공지능 시스템은 특정한 업무에 대해서 인간의 인지 시스템을 대체해서 인간에 비견되는 성능을 보여주는 것이다. 예로는 얼굴 인식이나, 의료 진단 시스템, 객체 검출 시스템, 음성 인식 시스템 등을 생각할 수 있다. 강인공지능 시스템이 만약 개발된다면 의료행위 역시 자동화 될 수 있겠지만 강화학습이 게임을 자동화의 수준에 머물러 있는 것을 근거로 삼아서 수십년 아니면 수백년이 걸릴 수 있다. 또한 인공지능 시스템의 발전과 같이 이러한 인공지능 시스템을 활용하여 인간의 인지능력 역시 상승할 것이다. 1500년대에 이황이 한국에서 성리학의 이기론(理氣論)으로 사람의 마음을 다루는 방법을 이(理)와 기(氣)로 구체화한 이후로 조선시대의 사람의 사고는 큰 발전을 거두었다고 생각할 수 있다. 인공지능 시스템이 사람의 생각을 보조할 수 있는 시스템을 만들고 이런 시스템을 사람들이 활용함으로써 더욱 사람들이 높은 수준의 사고를 할 수 있을 것이다. 이러한 부분에서 의료 인공지능 시스템은 의사들이 활용할 것이 아니라 병원 행정직과 같은 보조직들에게 맡겨야 한다고 생각된다. 의사들이 종합적인 판단을 하고, 인공지능을 사용해서 단위 진단을 보조직들이 수행하는 형태가 된다면 의사들이 가진 부담을 경감시키고, 더 조직적인 의료행위가 가능할 것으로 생각되기 때문이다.

 

3. 의료인공지능의 혁신성

 

의료 진단 시스템의 경우 약인공지능 시스템으로 하나의 목표 질환에 대해서 학습을 통한 진단 시스템을 구축할 수 있다. 이러한 학습된 시스템의 경우 앞에서 언급한 김남국 교수 연구팀과 같은 논문으로 쓰여지면, 해외에서도 해당 진단 시스템의 재구성이 가능하게 된다. 이러한 진단 시스템을 클라우드 컴퓨터에서 서비스 하고, GUI(Graphic User Interface) 등의 인터페이스를 만드는 일들을 부가적으로 수행해서 구체적인 상용 제품들이 나오게 된다. 이러한 진단 시스템의 기본 학습 파라미터가 공개가 되고 이를 환자군이 달라지는 것에 대한 커스터마이징은 돈을 받고 수행하는 형태가 될 수 있다고 하면 더욱더 인공지능 시스템의 발전은 빨리 오는 형태가 될수 있다. 이러한 커스터마이징 이전의 기본 학습 파라미터를 한국 시스템으로 해외에서 주로 사용하게 할 수 있다면 tensorflow나 pytorch 와 같은 인공지능 핵심 시스템을 공개하는 효과를 거둘 수 있다. 다양한 세부 진단 시스템이 충분히 갖추어지는 것을 향후 10년 이후에 가능하게 되리라고 기대한다. 하지만 이러한 세부 진단 시스템을 실제 의료현장에 적용하는 것은 기술적인 부분 외의 요소들이 많이 개입되는 문제이다. 왜냐하면 이러한 인공지능을 의사들만이 주도하는 방식으로는 쉽지 않기 때문이다. 의료 진단 시스템은 의사의 의료행위 중 복잡도가 높은 작업을 인공지능이 대체할 경우 의사의 의료 교육의 어려움을 해소되지만 책임을 누가 질지 등의 법적인 문제들이 상존하고 있다. 뷰노 회사의 뼈나이 측정과 같은 인공지능이 수행 가능한 세부적인 작업이 보건학과 출신의 인공지능 교육을 받은 행정직에 의해서 수행되게 될 수도 있을 것으로 보인다. 물론 종합적인 판단은 의사가 해야 하겠지만 전체를 구성하는 세부적인 판단의 근거가 되는 의료진단 행위는 보건 전공자를 통해서 진행될 가능성이 높고 이런 면은 많은 학과에서 인공지능에 대한 이수를 필수화하는 경향과도 잘 맞물려 있다. 의료행위가 높은 성적을 받은 최고 인재들에게 수행될 필요성을 경감 시켜주는 방향으로 개선되고 이런 의료 행위의 어려움의 감소 분만큼 의료 수가가 낮아지는 형태로 진전되었으면 한다. 그런 의료수가 경감을 위해서 본인이 교육하는 병원 행정직군들의 인공지능의 이해와 활용 능력은 필수적인 것이 되고 있는 추세이다.

 

맺음말

 

필자가 2년 동안 보건의료분야 문과 학부 학생들에게 인공지능을 교육하면서 느낀 점은 기본적인 뇌의 모델링을 언어와 영상 분야에서 이미 완료했다는 사실을 잘 받아들인다는 점이다. 인기가 없는 직군에 종사하는 학생들이 다수인 학과의 경우라도 새로운 변화에 적절한 교육을 통해서 잘 대처할 가능성을 발견할 수 있었다. 실제로 의료에 인공지능을 도입하는 책임이 무겁기 때문에 의료의 책임자인 의사와 간호사, 그리고 신경망의 실질적인 개발자들은 더 주도적으로 변화를 이끌어나갈 필요가 있다. 학생들은 실질적으로 신경망을 개발하진 않겠지만, 인공지능의 이해와 활용 능력을 통해서 새롭게 개발되는 시스템들을 잘 사용한다. 보조 인력의 능력이 적절히 활용될 수 있도록 의료 시스템이 구축되고 그러한 곳에서 의료의 혁신이 시작되어야 한다.

 


※참고문헌


 1) https://www.ukbiobank.ac.uk/
 2) https://aimi.stanford.edu/shared-datasets
 3) https://aihub.or.kr
 4) AI 학습용 데이터 190종 추가 개방381종으로 늘어, 대한민국 정책브리핑,https://www.korea.kr/news/policyNewsView.do?newsId=148903465

 5) https://www.tensorflow.org/
 6) 뷰노·루닛·딥노이드 등 식약처 인공지능 의료기기 허가 받은 110개 품목은, medigate 뉴스, https://m.medigatenews.com/news/2431153014

 7) 올해 RSNA 참가 국내 의료 AI 기업, 작년보다 2배 늘었다, AI타임스, http://www.aitimes.com/news/articleView.html?idxno=141760
 8) An Open Medical Platform to Share Source Code and Various Pre-Trained Weights for Models to Use in Deep Learning Research, Korean J Radiol 2021;22(12):2073-2081

 9) 기계와 결합하라, 로봇보다 강한 인간 되려면, 위클리 조선, http://weeklybiz.chosun.com/site/data/html_dir/2016/01/29/2016012901949.html

.
.
2022
공개SW 가이드/보고서 - 번호, 제목, 작성자, 조회수, 작성
번호 제목 작성자 조회수 작성
공지 [2024년] 오픈소스SW 라이선스 가이드 개정판 발간 file support 7714 2024-01-03
공지 [2024년] 기업 오픈소스SW 거버넌스 가이드 개정판 발간 file support 5887 2024-01-03
공지 [2024년] 공공 오픈소스SW 거버넌스 가이드 개정판 발간 file support 5825 2024-01-03
공지 공개 소프트웨어 연구개발(R&D) 실무 가이드라인 배포 file support 18377 2022-07-28
공지 공개소프트웨어 연구개발 수행 가이드라인 file OSS 17021 2018-04-26
434 [10월 월간브리핑] 오픈소스 쿠버네티스를 통한 혁신과 미래 support 2341 2022-10-25
433 [기획] K8s 운영/관리 위한 대표 오픈소스 도구들과 활용 추세 support 5118 2022-10-25
432 [기획기사] 클라우드의 중심 컨테이너 그리고 오픈소스 쿠버네티스 support 2309 2022-10-25
431 [9월 월간브리핑] 클라우드를 통한 오픈소스 DBMS 혁신과 발전 support 3599 2022-09-27
430 [기획기사] 금융기업에서 오픈소스 DBMS 사용현황 support 5056 2022-09-27
429 [기획] 기업의 오픈소스DBMS 활용추세와 상용 DBMS 한계점 support 13151 2022-09-27
428 [8월 월간브리핑] 의료산업 혁신을 가속화하는 오픈소스AI support 2878 2022-08-30
427 [기획] 슈퍼컴퓨터와 오픈소스가 만나 의료 발전을 만들다 support 2098 2022-08-30
426 [기고] 의료 AI 오픈소스 현황과 혁신 support 2764 2022-08-30
425 [7월 월간브리핑]오픈소스 프로젝트를 통해 성장하는 블록체인 support 2661 2022-07-26
맨 위로
맨 위로