[2월 월간브리핑]생성AI, 오픈소스 생태계를 통해 성장
support
게시글 작성 시각 2024-02-27 11:08:22
생성AI, 오픈소스 생태계를 통해 성장
- Open UP -
- 최근 생성AI 기술이 기업에 큰 관심을 불러일으키고 있으며, 기업들은 생성AI의 발전과 성장을 위해 협업 및 혁신 기반의 오픈소스 접근법을 채택
- ‘2023 오픈소스 생성AI 설문 조사 보고서’에 따르면 기업의 41%가 오픈소스 생성AI 기술을 선호하며, 기업의 69%는 오픈소스 생성AI을 채택하면 윤리적이고 책임 있는 AI 개발에 필수적인 데이터 제어와 투명성이 개선될 것이라고 응답
- 협업, 혁신 및 투명성 기반의 오픈소스 생태계, 생성AI 비즈니스에 더 큰 가치 제공
- 최근 생성AI 기술의 급격한 증가로 인해 개방형 솔루션과 폐쇄형 솔루션 사이의 논쟁이 주목받고 있으며 안전성, 접근성, 윤리성 등에 대한 논의가 활발히 이루어지고 있음
- Linux Foundation Research에서 발표한 ‘2023 오픈소스 생성AI 설문 조사 보고서’를 살펴보면 기업들은 생성AI의 발전과 성장을 위해 오픈소스 접근법을 채택하고 있음
- ‘2023 오픈소스 생성 AI 설문 조사 보고서’의 주요 인사이트
- 1) 생성 AI의 기업 내 사용 전략
- 조사 기업 중 50%가 이미 생성AI를 생산적인 맥락에서 사용하고 있음
- * 기업 내부의 응용 분야는 소프트웨어 개발(29%)과 문서 작성(34%)으로, 조직이 생성AI를 사용하여 코드 생성을 자동화하고 응용 프로그램 및 소스 코드에 대한 동적 문서 작성을 수행하고 있음
- 조사 기업 중 50%가 이미 생성AI를 생산적인 맥락에서 사용하고 있음
- 2) 생성AI에 대한 투자
- 조사 기업의 88%가 생성AI가 기업의 미래에 중요하다고 인식하고 있으며 기업의 60%는 생성AI에 대규모로 투자할 계획이라고 밝힘
- 3) 생성AI 기술의 맞춤화와 통합
- 조사 기업의 57%가 생성AI 기술을 자사의 필요에 맞게 맞추고 있으며, 생성AI 기술을 활용하여 기존 제품에 내장(27%)하거나 새로운 제품을 만들 계획(55%)을 가지고 있음
- 4) 오픈소스 생성AI의 선호도
- 조사된 기업의 41%가 오픈소스 생성AI 기술을 선호하며, 단 9%만이 독점 솔루션을 선호함
- * 이러한 선호도는 AI 커뮤니티 내에서 투명성, 협업 및 혁신을 기반으로 성장하려는 경향을 나타냄
- 오픈소스 생성AI는 독점 솔루션보다 협업, 혁신 및 통합 측면에서 더 우수하다고 인식됨
- * 오픈소스는 AI 알고리즘 및 데이터셋에 대한 접근을 민주화함으로써 개발자들이 생성AI에 기여하고 개선하며 비판할 수 있는 기회를 제공하고 있음
- 조사된 기업의 41%가 오픈소스 생성AI 기술을 선호하며, 단 9%만이 독점 솔루션을 선호함
- 5) 보안 고려 사항
- 대부분의 조직이 개인 정보 보호, 신뢰, 의도하지 않은 결과, 데이터 유출 및 남용 등과 같은 보안을 고려하여 생성AI 관련 프로젝트를 배포하지 않고 있으나, 이는 독점 솔루션이 더 안전하다고 여기는 결과는 아님
- * 그림 9와 같이 설문 응답자들은 독점 솔루션보다 오픈소스를 선호하는 경향을 나타내지만 설문 조사의 오차 범위는 두 가지 대안 사이에 상당한 차이를 보여주는 결과는 아님
- 대부분의 조직이 개인 정보 보호, 신뢰, 의도하지 않은 결과, 데이터 유출 및 남용 등과 같은 보안을 고려하여 생성AI 관련 프로젝트를 배포하지 않고 있으나, 이는 독점 솔루션이 더 안전하다고 여기는 결과는 아님
- 6) 생성AI 기술 중립성의 중요성
- 생성AI 기술을 개발할 때 95%의 기업이 중립적인 거버넌스 접근법의 채택을 중요하다고 응답
- * 이는 윤리적 고려와 편향되지 않은 의사 결정 과정, 책임 있는 개발이 필요함을 강조
- 생성AI 기술을 개발할 때 95%의 기업이 중립적인 거버넌스 접근법의 채택을 중요하다고 응답
- 7) 생성AI의 데이터 제어와 투명성
- 기업은 69%는 오픈소스 생성AI을 채택하면 윤리적이고 책임 있는 AI 개발에 필수적인 데이터 제어와 투명성이 개선될 것이라고 응답
- 42%가 다양한 데이터와 모델에 대한 접근성을 위해 오픈소스를 선호
- * AI 개발에서 데이터셋의 다양성이 더욱 확고하고 편향되지 않은 AI 시스템으로 이어질 수 있기 때문에 매우 중요함
- 1) 생성 AI의 기업 내 사용 전략
□ 주목할 만한 월간 이슈(2월)
- (금융) 금융보안원, 금융권 공급망 보안 위한 CVE 발급기관 지정
- 금융보안원이 미국 마이터(MITRE)로부터 CVE(Common Vulnerabilities and Exposures) 번호를 부여하고 등록·관리할 수 있는 CNA 기관으로 정식 지정됨
- * CVE란 오픈소스 등 소프트웨어에 존재하는 보안 취약점을 가리키는 국제 식별 번호
- 국내 CNA로는 6개 기관이 활동 중이며, 금융보안원은 금융권에서 사용 중인 소프트웨어 취약점을 발굴하고 취약점 유효성을 검증하여 특정 기준에 충족되는 결함이 있으면 CVE 번호를 부여한 후 이를 등록하고 관리하는 역할을 담당
- * 국내 CNA 6개 기관 중 삼성모바일/삼성TV&가전/LG전자/네이버/한화비전은 자사 제품에 한정되어 담당하며, 한국인터넷진흥원은 포괄적인 범위를 담당
- * 금융보안원은 국내에서 유일한 금융 분야 소프트웨어에 대해 포괄적인 역할을 하는 기관임
- 금융보안원이 미국 마이터(MITRE)로부터 CVE(Common Vulnerabilities and Exposures) 번호를 부여하고 등록·관리할 수 있는 CNA 기관으로 정식 지정됨
- (AI) 코히어포AI, 101개 언어 지원하는 오픈소스 LLM ‘아야(Aya)’ 발표
- 비영어권 국가의 디지털 격차를 해소하기 위해 인공지능(AI) 스타트업 코히어가 운영하는 비영리 연구소인 ‘코히어 포 AI(Cohere for AI)’가 101개 언어로 작동하는 새로운 다국어 오픈소스 대형언어모델(LLM) ‘아야(Aya)'를 출시
- * 기존 오픈소스 모델 대부분은 주로 영어와 중국어 데이터로 학습되지만 아야는 119개국 연구자 3,000명이 참여한 프로젝트로 개발되어 기존 오픈소스 LLM 언어의 두배 이상을 지원
- 모델에서 사용할 수 있는 114개 언어를 포괄하는 5억1300만개의 데이터 포인트 크기를 갖춘 현존 최대 규모의 다국어 훈련 데이터셋을 출시
- * 이 데이터셋은 소말리어와 우즈베크어와 같이 상업용 모델에서 흔히 찾기 어려웠던 50여개 이상의 언어로 적용 범위를 확장
- 비영어권 국가의 디지털 격차를 해소하기 위해 인공지능(AI) 스타트업 코히어가 운영하는 비영리 연구소인 ‘코히어 포 AI(Cohere for AI)’가 101개 언어로 작동하는 새로운 다국어 오픈소스 대형언어모델(LLM) ‘아야(Aya)'를 출시
- (의료) 카카오브레인, 의료영상 판독문 병명 추출하는 '레이블러 프로젝트' 공개
- 흉부 X레이 판독문에서 특정 병명을 추출하는 의료영상 판독문 전문 '레이블러 프로젝트'를 AI 오픈 소스 생태계 활성화를 위해 깃허브에 공개
- * 지난 1월말에는 레이블러의 학습법과 성능 비교 결과를 담은 논문 ‘대형언어모델을 활용한 향상된 흉부 X선 판독문 라벨링(CheX-GPT)'을 논문 공개 사이트 아카이브에 게재
- 레이블러 프로젝트는 여러 유형 자연어 판독문에서 특정 병명을 추출하는 연구 개발 프로젝트
- * 사용자가 자연어로 작성한 판독문을 입력하면, 분석 진행 후 13개 병명에 대한 양성 또는 음성 여부를 확인
- 흉부 X레이 판독문에서 특정 병명을 추출하는 의료영상 판독문 전문 '레이블러 프로젝트'를 AI 오픈 소스 생태계 활성화를 위해 깃허브에 공개
- (게임) 스팀 오디오 개발자 키트, 오픈소스로 배포
- 스팀 오디오 개발자 키트(Steam Audio Software Development kit)가 전체 소스 코드를 아파치 라이선스 2.0이 적용하여 오픈소스로 전환
- 스팀오디오의 개발진은 추가 개발 기능에 대한 선택은 내부 프로젝트에서 필요한 경우 진행되므로 유저들이 필요한 기능을 필요에 맞게 최적화할 수 있도록 오픈소스로 개방한다고 밝힘
- * 개발자 키트를 사용하는 유저들은 자신의 필요에 맞게 프로그램을 조정하고, 조정한 소프트웨어를 유저들에게 공유할 수 있을 전망
□ 시사점
- Linux Foundation Research에서 발표한 ‘2023 오픈소스 생성AI 설문 조사 보고서’를 살펴보면 기업들은 생성AI의 발전과 성장을 위해 오픈소스 접근법을 채택하고 있음
- 조사 기업의 88%가 생성AI가 기업의 미래에 중요하다고 인식하고 있으며 기업의 50%는 이미 생성AI를 생산적인 맥락에서 사용하고 있음
- 조사 기업의 41%가 오픈소스 생성AI 기술을 선호하며, 단 9%만이 독점 솔루션을 선호하며, 협업, 혁신 및 통합 측면에서 오픈소스가 더 우수하다고 인식하고 있음
- 기업은 69%는 오픈소스 생성AI을 채택하면 윤리적이고 책임 있는 AI 개발에 필수적인 데이터 제어와 투명성이 개선될 것이라고 응답
※ 참고 Reference
- LF Research GenAI Survey Report Reveals That Open Models Offer Greater Value for Business, The Linux Foundation, 2024.1.31.
https://www.linuxfoundation.org/blog/maintainer-motivations-challenges-and-best-practices-on-open-source-software-security-0 - 2023 Open Source Generative AI Survey Report, The Linux Foundation, 2023.12.,
https://www.linuxfoundation.org/research/2023-generative-ai-study - 금융보안원, 금융권 공급망 보안 위한 CVE 발급기관 지정, 전자신문, 2024.2.7.,
https://www.etnews.com/20240207000021 - 코히어, 101개 언어를 위한 오픈소스 LLM 출시..."비 영어권을 위한 노력" AI타임스, 2024.02.14.,
https://www.aitimes.com/news/articleView.html?idxno=157175 - 카카오브레인, 의료영상 판독문서 병명 추출하는 '레이블러 프로젝트' 깃허브에 공개, AI타임스, 2024.02.19.,
https://www.aitimes.com/news/articleView.html?idxno=157289 - 스팀 오디오 SDK, 오픈 소스로 배포된다, 게임메카, 2024.02.20.,
https://www.gamemeca.com/view.php?gid=1745992 - 공개SW 포털(oss.kr) ‘공개SW 소식’ 참조
Open UP에 의해 작성된 이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다.
.
.
2024
0개 댓글