본문 바로가기

 
의료 산업 혁신을 가속화하는 오픈소스 AI
- Open UP -

 

  • 의료계 오픈소스 기술은 과거에는 주로 데이터를 저장하고 처리하는 기술에 집중됐었지만 최근 헬스케어 시장 성장과 더불어 AI를 활용한 오픈소스 기술도 증가

    1. 글로벌 대형 기업들이 특히 의료 시장에 영향력을 높이기 위해 자사 기술을 접목한 오픈소스 프로젝트를 공개 및 서비스 등장

  • AI 연구에는 대규모 인프라와 데이터가 필요하다는 점을 인식해 정부나 학계에서 기반 기술을 만드는 노력을 진행

    1. 의료 데이터는 민감한 개인정보를 포함하는 경우가 많아 개인이 접근하기 어려운데, 학계나 정부가 협업해 오픈 데이터나 관련 도구를 공개하는 사례가 늘고 있음

 

□ 의료 분야의 오픈소스 기술을 AI와 접목하려는 기업은 주로 대형 IT 기업으로 대규모 의료 데이터와 인프라를 갖춘 덕에 다양한 실험을 할 수 있음. 특히 마이크로소프트(MS), 인텔, 딥마인드 같은 대형 기업들이 의료 AI 오픈소스 프로젝트를 진행중

  1. - 과거 의료 분야 오픈소스 기술은 주로 EMR(Electronic Health Record) 같은 병원의 데이터를 관리하는 소프트웨어가 많았지만, 이제는 단순히 데이터를 모으는 것 이상으로 새로운 통찰력을 제공하는 프로젝트가 성장 중.
  2. - 오픈소스 AI 기술은 주로 ▲진단의 정확성을 높이거나 ▲질병을 예측하거나 ▲의료 종사자의 의사결정을 도움을 주는 역할을 하고 있음

    - IT 기업은 자체 AI 엔진 기술이나 인프라 기술을 활용할 수 있도록 오픈소스 기술을 만들어 여러 기관과 협업 중

    -대학 연구기관은 AI 연구 논문을 공개하면서 관련 소스코드도 함께 공개하거나, 사회 기여 목적으로 처음부터 의료기관을 위한 오픈소스 기술을 만들고 있음

 

  • 마이크로소프트는 ‘프로젝트 이너아이(Project InnerEye)’라는 오픈소스 기술을 공개하고 의료계와 협업

    1. 프로젝트 이너아이는 영국의 마이크로소프트 리서치 팀이 개발한 기술로 엑스레이, CT 같은 의료 사진을 전문적으로 분석하고 AI 모델을 구축할 수 있도록 도와줌. 캠브리지대, 런던대 등에서 도입

    2. 마이크로소프트는 암 치료 과정에서 CT 사진을 분석하는데 시간이 너무 많이 걸린다는 점을 주목해 이너아이를 활용한 AI가 알아서 암 추정 부위를 찾아서 표시할 수 있도록 구축

    3. 실험 결과 이너아이를 활용한 기술을 도입한 곳에서 CT 사진 속 암 부위를 최대 13배 빠르게 찾을 수 있었다고 설명

 

  • 인텔도 데이터 분석과 인공지능 개발을 돕는 ‘오픈비노(OpenVINO)’라는 도구를 오픈소스로 공개. 오픈비노는 다양한 산업에서 쓰일 수 있으나 특히 의료 시장 활용 사례가 많이 나오고 있음

    1. 가령 국내 헬스케어 스타트업 루닛은 폐 질환 진단 보조 AI 소프트웨어에 오픈비노를 적용해서 CPU 기반에서도 데이터 처리 속도를 높일 수 있게 지원

    2. 대만의 의료 기기 개발 업체 오닉스 헬스케어(Onyx Healthcare)는 오픈비노를 활용해 약품 인식 기기를 만들었는데, AI 기능을 고도화하면서 생김새가 비슷한 약품을 실시간으로 분석해 의약품 처방 결과의 정확도를 높였으며, 약사가 짧은 시간 안에 자신이 처방한 약품의 종류와 개수가 이상이 없는지 다시 확인할 수 있었다고 설명

 

  • 알파고를 만든 것으로 유명한 알파벳 산하 기업 딥마인드는 단백질 구조를 예측하는 ‘알파폴드2(AlphaFold2)’를 오픈소스로 공개

    1. 단백질 구조는 질병에 대한 치료나 신약, 생명과학 연구를 진행하는데 필수적인 정보로 지금까지 발견된 단백질 구조는 약 2억 개로 매년 새로운 단백질 구조가 추가로 발견

    2. 딥마인드는 알파폴드2로 그동안 알려지지 않은 새로운 단백질 구조를 AI로 더 빠르게 발견하고 예측할 수 있다고 설명

    3. 이전에 공개한 알파폴드1은 소스코드를 공개하지 않아서 실제 효능을 학계에서 확인하기 어려웠지만 알파폴드2는 오픈소스 기술로 공개돼서 기술의 투명성을 높였다는 평가를 받음

  •  
  • IBM 오픈소스 ‘왓슨’ 이용해 의료,헬스케어 진출

    1. IBM은 왓슨(watson)을 기반으로 하는 헬스클라우드를 구축했다. 왓슨은 일반인이 사용 하는 언어 형식의 질문에 답할 수 있도록 만들어진 IBM의 인공지능 컴퓨터 시스템임.

    2. 2012년 3월 왓슨은 세계에서 가장 오래되었고, 가장 큰 사립병원인 뉴욕의 메모리얼 슬론 캐터링 암센터(Memorial Sloan Kettering Cancer Center, 이하 MSKCC)와 협업을 통해 암의 치료에 도전하겠다고 밝힘. 실제 의사들이 어떻게 암 환자를 치료하고, 진단을 내리며, 치료에 대한 의사 결정을 학습하기 위한 것. IBM과 MSKCC는 공동연구를 통해 처음에는 폐암을 시작으로 유방암 등 다른 암종으로 범위를 넓혀가겠다는 계획을 발표.

    3.  
    4. 나라별 산업용 로봇 도입 현황(출처:IFR)

      IBM 왓슨 포 온콜로지를 이용해 환자를 진료하는 모습

    5. 출처 : https://www.etnews.com/20180227000087

    6.  
    7. 그렇게 개발이 시작된 것이 바로 왓슨 포 온콜로지(Watson for Oncology)이임. 2013년 2월에 IBM의 보도자료에 따르면, 당시까지 왓슨은 암과 관련된 60만 건의 의학적 근거, 42개의 의학 학술지와 임상 시험 데이터로부터 200만 페이지 분량의 자료를 학습했다고 나옴.

    8. 2017년 6월 보도에 따르면, 왓슨 헬스 측은 연내로 왓슨 포 온콜로지를 총 12개 암종에 적용 가능하도록 발전시켜, 전 세계에서 발병하는 암의 80%를 커버할 수 있을 것이라고 밝힘.

 

  • 의료, 헬스케어와 오픈소스가 연결된 다양한 오픈소스 소프트웨어가 서비스 중. 가장 대표적인 서비스는 애플의 오픈소스 소프트웨어 리서치 킷

    1. 애플의 오픈소스 소프트웨어 리서치 킷은 의학 및 건강 리서치를 위해 의사, 과학자 등 의학 연구자들로부터 좀 더 자주, 정확하게 인공지능을 사용해 데이터를 모을수 있음.

    2. 리서치킷으로 전 세계 의학 전문 연구원들은 그들의 연구를 위해 리서치킷을 활용한 독자적인 앱 개발이 가능하고 개발자들은 오픈소스 프레임 워크에 새로운 연구 모듈을 추가할 수 있음.

    3. 리서치 킷이 의료 연구의 지역적 시간적 한계를 초월 하는데 큰도움이 된다는 분석이 있음.

      1. *미 경제 전문 포춘은 아이칸 의과대학의 마운트 시나이 병원 연구자 들이 진행한 리서치킷을 이용한 천식의 이동 건강 연구에 주목
      2. *리서치킷이 다양한 지리적 위치에서 신속하게 등록해야 하며 실시간으로 빈번한 데이터 수집이 필요한 짧은 기간의 연구에 적합다고 밝힘.
      3.  
      4. 나라별 산업용 로봇 도입 현황(출처:IFR)

        리서치킷

      5. 출처:https://m.medigatenews.com/news/580242107

 

  • 컴퓨팅 기술로 유명한 엔비디아도 최근 의료, 헬스케어로 사업 영역을 확장.

    1. 헬스케어로 영역을 넓히는 이유는 코로나 이후 디지털 헬스케어 산업이 급부상 중이기 때문.

    2. 나라별 산업용 로봇 도입 현황(출처:IFR)
    3. 디지털헬스케어 시장 규모

      출처 : https://byline.network/2022/02/14-196/

    4.  

    5. 오픈소스 소프트웨어 개발 키트인 엔비디아 FLARE는 연합학습을 위한 공통 컴퓨팅 기반을 제공해 의료 산업에서 AI 사용을 가속화

      1. *FLARE를 통해 엔비디아는 췌장 종양을 분할하고 유방 조영술에서 유방 밀도를 분류해 유방암 위험을 판단하는 프로젝트를 주도했다. 코로나19와 관련해서는 환자의 산소 요구량을 예측하는 연구를 진행해 네이처 메디슨에 논문을 발표.
      2. *해당 연구에서는 EXAM(electronic medical record (EMR) chest X-ray AI model)라는 연합학습 모델 학습을 위해 전세계 20개 기관 데이터를 사용함. EXAM 모델은 바이탈 사인, 실험실 데이터, 흉부 엑스레이 데이터를 사용해 코로나19 증상이 있는 환자의 미래 산소 요구량을 예측함.
      3.  
    6. 나라별 산업용 로봇 도입 현황(출처:IFR)
    7. NVIDIA FLARE를 사용하여 흉부 이미지를 더 좋은 품질로 재구성

      출처:https://www.fierceelectronics.com/electronics/nvidia-open-sources-flare-sdk-and-names-ai-enterprise-healthcare-users

      1.  

        *연구 결과, 단일 장소에서 해당 장소만의 데이터를 사용해 학습한 모델과 비교했을 때 EXAM 활용 시 일반화 가능성이 38% 증가했다. 모든 장소에서 측정된 평균 정확도(AUC) 값은 16% 개선됨.
      2. *미국 방사선과 대학(American College of Radiology)은 수만 명의 의료학회 회원이 사용할 수 있는 소프트웨어 플랫폼인 ACR AI-LAB에 FLARE를 통합할 계획임.
      3. 라이노 헬스(Rhino Health)는 FLARE를 연합 학습 시스템에 통합했음. 연구원들은 뇌동맥류를 정확하게 진단하는 AI 모델을 개발하기 위해 라이노 헬스의 도구를 사용하고 있음.

 

□ 해외 학계, 기관에서 공개한 오픈소스 프로젝트의 목적은 의료 연구 및 활동에 AI 기술 도입을 편리하게 하기 위한 것이 대부분임. 의료데이터를 활용한 머신러닝 기술도입을 쉽게하는 오픈소스 도구, AI 기술적용 전 필수 준비사항인 의료관련 데이터(예: 흉부, 뇌, 피부 등)들을 라벨링 하는 오픈소스 도구, AI 연구와 협업을 돕는 오픈소스 도구 등을 소개함.

  • MIT에서 데이터와 AI 기술을 집중적으로 연구하는 DAI 랩은 머신러닝 기술을 의료기관에서 더 쉽게 도입할 수 있도록 ‘카르데아(Cardea)’를 오픈소스로 2021년 공개

    1. 카르데아는 자동화 머신러닝(AutoML) 기술로 예측 모델을 처음부터 모두 구축할 필요 없이, 목표 상황과 방식만 입력하면 알아서 필요한 모듈과 기술을 처리함

    2. MIT 연구진은 카르데아가 데이터 분석이나 인공지능에 대한 깊은 지식이 없는 비전문가도 이용할 수 있는 수준으로 구축했으며, 특히 병원 내 의사 결정권자가 쓰기 좋게 구현했다고 소개

    3. 사용자는 카르데아를 활용해 입원 환자 일정을 분석해 앞으로 얼마나 많은 병상이 남을지 혹은 부족할지 예측할 수 있으며, 그 과정에서 원하는 대로 예측 모델을 선택해 데이터에 대한 다양한 분석을 수행 할 수 있음

    4. 나라별 산업용 로봇 도입 현황(출처:IFR)
    5. 카르데아 구조.

      출처:https://arxiv.org/pdf/2010.00509.pdf

 

  • 스탠포드 대학의 의약 및 이미징 AI(AIMI) 센터는 인공지능 학습에 쓰일 수 있는 데이터를 익명화해서 오픈소스로 공개하고 데이터 라벨링 도구도 함께 공개

    1. AIMI 센터를 이끄는 스탠포드 방사선학과의 매트 룽런 교수는 “AI 업계를 이끄는 원동력은 데이터”라고 강조하며, 관련 연구가 많아질 수 있도록 데이터를 공유했다고 설명

    2. 공개된 데이터는 흉부, 뇌, 피부 등 분야를 포함한 100만 개가 넘으며, 라벨링 작업 및 익명화 작업도 모두 진행

    3. 라벨링 작업에 사용된 MD.AI라는 프로그램의 일부도 오픈소스로 공개

AI 랩 스컨크웍스에서 운영 중인 오픈소스 프로젝트

 

  • 보건복지부와 유사한 역할을 하는 영국 정부기관 NHS(National Health Service)은 AI 연구와 협업을 전문적으로 하는 AI 랩(Lab)에서 오픈소스 기술을 직접 개발

    1. AI 랩에서는 규제, 윤리, 후원, 기술 등 다양한 분야의 지원 프로그램을 운영 중인데 그중에서도 ‘AI 랩 스컨크웍스(AI Lab Skunkworks)’에서 헬스케어 및 공중 보건에 도움이 될 만한 기술을 개발하는 역할을 하고 있음

    2. AI 랩 스컨크웍스에서 만드는 기술 모두 오픈소스로 공개하고 있으며, 현재까지 6개의 프로젝트와 AI 도입 교육 자료가 포함

    3. 각 프로젝트는 소스코드와 함께 실제 병원과 협업한 사례, 그리고 정부 내 기술 관리 담당자 정보도 함께 명시

나라별 산업용 로봇 도입 현황(출처:IFR)

  • NHS에서 개발한 장기입원 환자 분석 도구

    출처 :https://github.com/nhsx/skunkworks-long-stayer-risk-stratification

 

□ 주목할 만한 월간 이슈(8월)

  • (SW) 미국 상무부가 차세대 프로세서를 만들 때 꼭 필요한 첨단 반도체 디자인 소프트웨어 수출 통제 명령을 발령
    1. 프로토콜에 따르면 미국 정부의 이번 조치는 중국 반도체 기업들이 AI 관련 응용 프로그램을 제작하는 것을 막기 위한 것
    2. 특히 차세대 기술인 'GAA(Gate All Around)'를 활용해 반도체를 제작할 때 사용되는 칩 디자인 소프트웨어 수출 금지에 초점을 맞춰질 전망.
    3. 이번 조치로 전자설계자동화(EDA) 소프트웨어가 직접 영향을 받게 될 전망.EDA란 미리 짜놓은 컴퓨터 프로그램을 통해 반도체 회로 설계와 오류 검증을 처리·분석하는 작업을 의미.
  • (보안) 한국인터넷진흥원(KISA)은 사이버 위협으로부터 안전한 디지털 생태계 조성을 위해 '인공지능 보안 기술에 활용할 수 있는 악성앱 특징정보'를 공개
    1. 디지털 가속화로 인해 모바일 매체를 통한 비대면 서비스가 일상화되면서, 사용자의 모바일 단말기에 금융·정부기관 앱으로 위장한 악성앱 설치를 유도해 금융정보와 같은 민감한 개인정보를 탈취하는 보이스피싱 등 피해가 발생.
    2. KISA는 기업의 보안수준 향상 및 강화된 보안 서비스를 국민에게 제공할 수 있도록 작년에 공개한 '악성코드 특징정보'에 이어, 모바일 환경을 향한 사이버 위협으로부터 기업·국민의 피해를 예방하기 위해 이번 '인공지능을 활용한 악성앱 특징정보'를 공개.
    3. 이번에 공개된 악성앱 특징정보는 ▲메타데이터(파일의 일반속성) ▲네트워크(통신) ▲악성앱 관련 공격전략 및 기술(ATT&CK Matrix) ▲다이나믹 인포 ▲파일의 동적행위 및 정적 정보 ▲그 외 부가데이터 등 6개의 항목으로 분류. 세부 특징정보 43개와 예시 데이터 및 설명도 함께 제공.
    4. 기업이 요청할 경우 특징정보 관련 원천 데이터(악성앱 샘플 IoC) 및 데이터셋도 제공 가능.
  • (플랫폼) 깃허브, '디펜다봇'경고로 오픈소스 코드 보안 강화
    1. 마이크로소프트 소유 오픈소스 코드 저장소 깃허브(GitHub)가 보안 업데이트 사항을 공개.
    2. 깃허브가 취약한 깃허브 액션(GitHub Actions) 발견 시 ‘디펜다봇(Dependabot)’으로 경고를 보냄. 깃허브 액션은 깃허브 플랫폼에서 제공하는 지속적 통합 및 지속적 공급(Continuous Integration and Continuous Delivery, CI/CD) 솔루션으로 사용자들이 소프트웨어 개발 파이프라인 자동화를 도움.
    3. 경고 시스템은 깃허브 어드바이저리 데이터베이스(GitHub Advisory Database)를 기반으로 알림 메시지를 전달함.
    4. 깃허브 어드바이저리 데이터베이스는 보안 취약점에 관한 데이터베이스로 공개적으로 알려진 컴퓨터 보안 결함 목록(Common Vulnerabilities and Exposures, CVEs)을 포함하며 오픈소스 소프트웨어를 통하여 구축한 깃허브만의 보안 어드바이저리도 포함.
    5. 오픈소스 코드는 해커 세력이 공격에 자주 악용하는 경로임. 깃허브 외에도 여러 기업에서 오픈소스 코드의 취약점을 발견하고 대응하기 위하여 노력중임. 최근 들어 오픈소스의 사이버 보안은 테크 업계 전반의 관심 대상이 됨. Log4j 공격 등 오픈소스 코드 보안 문제가 최근 몇 년간 막대한 피해를 준 대규모 사이버 공격의 원인으로 드러난 사례가 증가했기 때문임.
  • (AI) 기상청은 22일부터 인공지능(AI) 기법을 적용한 천리안위성 2A호 토양수분자료를 실시간으로 제공해 국내 전 지역 가뭄 감시를 지원
    1. 천리안위성 2A호가 제공하는 토양수분자료는 기상청과 부경대학교가 함께 개발한 AI 모형을 이용해 산출한 것으로 지상관측자료와 비교해 절대오차 약 4.3%, 상관계수 약 0.72로 우수한 품질을 나타냄.
    2. 반면에 천리안위성 1호 토양수분자료는 상관계수가 약 0.47이었고, 미국항공우주국의 전지구지표자료동화체계(GLDAS·Global Land Data Assimilation system) 토양수분자료는 지상관측자료 보다 약 0.22의 상관계수를 나타냄.
    3. 천리안위성 2A호 토양수분자료는 기상청 수문기상 가뭄정보 시스템을 통해 행정구역과 수자원 단위(대권역, 중권역, 표준유역)로 하루에 한 번 제공.
    4. 토양수분자료는 ▲영농기 대비 가뭄 감시 및 전망 ▲건조에 따른 산불발생위험도 ▲토양수분 과잉에 따른 산사태 발생 조기 감시 등 다양한 분야에 활용될 수 있음.
  • (클라우드) 클라우드의 회복 탄력성을 높이는 데 필요한 비용은 얼마일까
    1. 클라우드 서비스 업체는 사용자에게 회복 탄력성을 높일 수 있는 기능을 별도로 제공한다. 비용만 투자하면 얼마든지 회복 탄력성을 높일 수 있는데, 사실 적절한 비용을 알기 쉽지 않음.
    2. 컨설팅 업체 업타임 연구소(Uptime Institute)는 흥미로운 연구 결과를 공개했으며, 보호 기능이 없는 기본 서비스에 회복 탄력성을 높이려면 비용이 최대 111% 높아질 수 있다고 밝힘.
    3. 업타임 연구소는 클라우드 서비스 업체는 “가용 영역에서는 기본적으로 회복 탄력성을 높일 수 있는 기능을 많이 제공하며, 적은 비용을 추가한 것 치고는 꽤 높은 가용성을 확보할 수 있다”라고 밝혔다. 또한 “회복 탄력성이 더 높은 구조에서는 가용성이나 가동 중단 보상을 의미 있는 수준으로 보장하지 않을 수 있다는 점을 주의해서 알고 있어야 한다”라고 설명

 

 

※ 참고문헌 Reference

 

 

Creative Commons LicenseOpen UP에 의해 작성된 이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다.
.
.
2022
공개SW 가이드/보고서 - 번호, 제목, 작성자, 조회수, 작성
번호 제목 작성자 조회수 작성
공지 [2024년] 오픈소스SW 라이선스 가이드 개정판 발간 file support 7714 2024-01-03
공지 [2024년] 기업 오픈소스SW 거버넌스 가이드 개정판 발간 file support 5887 2024-01-03
공지 [2024년] 공공 오픈소스SW 거버넌스 가이드 개정판 발간 file support 5824 2024-01-03
공지 공개 소프트웨어 연구개발(R&D) 실무 가이드라인 배포 file support 18377 2022-07-28
공지 공개소프트웨어 연구개발 수행 가이드라인 file OSS 17021 2018-04-26
434 [10월 월간브리핑] 오픈소스 쿠버네티스를 통한 혁신과 미래 support 2341 2022-10-25
433 [기획] K8s 운영/관리 위한 대표 오픈소스 도구들과 활용 추세 support 5118 2022-10-25
432 [기획기사] 클라우드의 중심 컨테이너 그리고 오픈소스 쿠버네티스 support 2309 2022-10-25
431 [9월 월간브리핑] 클라우드를 통한 오픈소스 DBMS 혁신과 발전 support 3599 2022-09-27
430 [기획기사] 금융기업에서 오픈소스 DBMS 사용현황 support 5056 2022-09-27
429 [기획] 기업의 오픈소스DBMS 활용추세와 상용 DBMS 한계점 support 13151 2022-09-27
428 [8월 월간브리핑] 의료산업 혁신을 가속화하는 오픈소스AI support 2878 2022-08-30
427 [기획] 슈퍼컴퓨터와 오픈소스가 만나 의료 발전을 만들다 support 2098 2022-08-30
426 [기고] 의료 AI 오픈소스 현황과 혁신 support 2763 2022-08-30
425 [7월 월간브리핑]오픈소스 프로젝트를 통해 성장하는 블록체인 support 2660 2022-07-26
맨 위로
맨 위로