2026.04.28
[4월 월간브리핑] 오픈소스 AI 생태계 확장과 참여 구조 변화 - Hugging Face Spring 2026 분석
- Open UP -
|
1. 오픈소스 AI 생태계의 활동은 사용자, 모델, 데이터셋 저장소 수 모두 거의 두 배 수준으로 증가하면서 빠르게 성장하고 있으며, 수동적인 소비 구조에서 적극적인 참여 중심 구조로 전환되고 있음 - 사용자 수는 약 1,300만 명, 공개 모델 수는 200만 개 이상, 공개 데이터셋은 50만 개 이상으로 확대(2025년 기준) - 단순 모델 소비에서 벗어나 파인튜닝 모델, 어댑터, 벤치마크, 애플리케이션 등 파생 산출물 생성 증가 - 오픈소스 AI 활용 방식이 단순 사용에서 생성 및 확장 중심으로 변화하고 있는 것으로 분석됨 - 오픈소스 AI 생태계 개발 주체 중 기업 비중은 2022년 이전 약 70%에서 2025년 약 37%로 감소한 반면, 개인 및 독립 개발자 비중은 17%에서 39%로 증가하며 구조 변화가 나타남 - 모델 개발은 규모 중심에서 벗어나 접근성과 효율성을 중시하는 방향으로 변화하면서, 소형 모델이 대형 모델 대비 더 높은 다운로드 및 배포 비율을 보이고 있음 |
□ 오픈소스 AI 생태계는 규모 확대와 함께 재사용·파생 개발 중심의 참여형 구조로 전환
○ 오픈소스 생태계는 AI 개발, 활용, 배포와 같은 실질적인 작업이 이루어지는 중심 영역이며, AI 전체 생태계에 대한 영향력은 지속적으로 확대되고 있음
- 오픈소스는 AI 시스템을 구축하고, 평가하고, 관리하기 위한 기초 인프라 계층이며, 에이전트 기반 시스템이 확대됨에 따라, 오픈소스와 그 상호운용성은 에이전트의 성공적인 운영에 핵심적인 요소가 될 것임
○ 허깅페이스 데이터를 기반으로 오픈소스 AI 생태계를 살펴보면 규모, 참여 주체, 지역, 기술 트렌드 전반에서 구조적 변화가 나타나고 있음
- 사용자 및 모델 증가뿐 아니라, 파생 모델과 응용 개발이 확대되며 생태계의 활용 방식이 변화하고 있음
- 본 브리핑에서는 ‘State of Open Source on Hugging Face: Spring 2026’ 분석을 바탕으로 오픈소스 AI 생태계의 주요 변화와 특징을 정리함
▶ 오픈소스 AI 생태계 규모 확대와 구조적 특징
○ 오픈소스 AI 생태계의 활동은 사용자, 모델, 데이터셋 저장소 수 모두 거의 두 배 수준으로 증가하면서 빠르게 성장
- 2025년 기준 허깅페이스의 사용자 수는 약 1,300만 명, 공개 모델 수는 200만 개 이상, 공개 데이터셋은 50만 개 이상으로 확대
- 사용자들은 사전 학습된 모델을 단순히 사용하는 수동적인 소비 구조에서 파인튜닝 모델, 어댑터, 벤치마크, 애플리케이션과 같은 파생 산출물을 더 많이 생성하는 적극적인 참여 중심 구조로 전환되고 있음
○ 오픈소스 AI 생태계는 빠르게 성장하고 있으나, 인기와 사용은 일부 모델에 집중되는 구조를 보임
- 전체 모델 중 약 절반은 다운로드 수 200회 미만으로 나타났으며, 상위 200개 모델(전체의 0.01%)이 전체 다운로드의 약 49.6% 차지
- 전체 다운로드 수가 많지 않더라도 특정 도메인·언어 중심의 특화된 커뮤니티가 형성되며 지속적인 재사용과 참여가 나타남
- 오픈소스 AI는 단일 시장이 아닌 여러 하위 생태계가 중첩된 구조로 분석됨
- 오픈 모델은 다른 개발자들의 재사용·변형·특화를 통해 다양한 AI 서비스와 애플리케이션으로 확산되고 있으며, 오픈소스 결과물이 투입 비용 대비 더 큰 가치를 창출하는 경향이 AI 분야에서도 나타남
- 반면, 클로즈드 시스템에만 의존하는 조직은 더 높은 비용을 부담하게 되며, 배포 및 커스터마이징 측면에서 유연성이 제한되는 경향이 있음
▶ 참여 주체 변화와 개인·커뮤니티 역할 확대
○ 오픈소스 AI 생태계에서 기업 중심 구조가 변화하며 개인 및 독립 개발자의 비중이 확대되고 있음
- 산업(기업)의 전체 개발 비중은 2022년 이전 약 70% 수준에서 2025년에는 약 37%로 감소
- 개인 및 독립 개발자 비중은 17%에서 39%로 증가
- 신규 트렌드 모델 개발 주체 중 개인 사용자가 네 번째로 많은 비중을 차지
- 그러나 가장 인기 있는 모델은 주로 대형 조직에서 개발되었으며, 그 대부분은 미국과 중국에 속해 있었음
- 개인 및 소규모 집단은 기본 모델을 양자화·수정·재배포하는 중간 계층으로 확대되며 일반 사용자의 모델 선택과 활용 방식에 영향을 주고 있음
▶ 지역별 생태계 변화와 경쟁 구조 재편
○ 오픈소스 AI 생태계의 지리적 구성 변화가 나타나며 국가 간 경쟁 구조가 강화되고 있음
- 미국과 중국은 역사적으로 주요한 기여 지역이며, 영국, 독일, 프랑스가 그 뒤를 잇는 구조를 보임
- 중국이 월간 및 전체 다운로드에서 미국을 상회하였으며, 지난 1년 동안 중국 모델이 전체 다운로드의 약 41% 차지하며 가장 큰 비중을 형성
- 중국은 AI 솔루션 출시와 활용 측면에서 좀더 주도적인 위치를 차지하고 있음
- 2025년에 새롭게 생성된 모델 중, 대부분의 트렌드 모델은 중국에서 개발되었거나, 중국에서 개발된 모델을 기반으로 한 파생 모델이었음
|
▶ 2025년 중국 AI 생태계는 오픈소스로 크게 방향을 전환 - 1월 DeepSeek의 R1 모델이 빠르게 확산되면서 촉발되었으며, 경쟁력 있는 중국 조직의 모델 출시 및 허깅페이스 내 저장소 수가 급격히 증가 - Baidu는 2024년에는 Hub에 모델을 전혀 공개하지 않았지만, 2025년에는 100개 이상의 모델을 공개 - ByteDance와 Tencent는 각각 모델 공개 수를 8~9배 증가 - Baidu와 MiniMax처럼 이전에는 클로즈드 접근을 선호하던 조직들도 명확하게 오픈소스 방향으로 전환 |
- 미국과 서유럽은 구글, 메타, 오픈AI, 스태빌리티 AI와 같은 대형 산업 연구소를 중심으로 생태계를 주도
|
▶ 미국의 주요 조직들은 지속적으로 더 많은 저장소를 공개 - Meta(구 Facebook 연구 조직 포함)는 오픈 모델 공개에서 상당한 비중을 차지하고 있으며, Google 역시 그보다는 적지만 일정 수준 기여 중임 |
- 프랑스, 독일, 영국은 연구기관, 국가 단위 AI 전략, 특화된 모델 계열을 통해 지속적으로 기여
- 한국 등 일부 국가는 국가 단위 AI 전략을 통해 생태계 참여 확대
▶ 글로벌 오픈소스와 기술 주권(Sovereignty)
○ 오픈소스 AI는 점점 더 기술 주권 확보와 연계되고 있으며, 각국은 자국 데이터와 인프라 기반 AI 생태계 구축을 확대하고 있음
- 오픈 가중치 모델을 활용해 정부·공공기관이 자국 법·데이터 기반으로 모델을 파인튜닝하고 운영하는 구조 확산
- 자국 하드웨어 기반 모델 운영을 통해 외국 기업이 통제하는 클라우드 의존도를 낮추는 방향으로 발전
- 모델 구조·학습·평가 과정의 투명성은 규제 대응과 공공 책임성 확보에 기여
|
국가 단위의 움직임 - 한국은 국가 주권 AI 이니셔티브를 통해 주요 기업(LG AI Research, SK Telecom, Naver Cloud, NC AI, Upstage 5개사) 중심의 국내 모델 개발을 추진하고 있으며, 일부 모델은 글로벌 플랫폼에서 트렌딩에 진입하는 등 가시적 성과 나타남 * 2026년 2월에는 한국에서 개발된 모델 3개(LGAI-EXAONE/K-EXAONE-236B-A23B, upstage/Solar-Open-100B, skt/A.X-K!)가 동시에 Hugging Face Hub에서 트렌딩에 오름 * 2026년 3월에는 한국과 미국 스타트업 Reflection AI가 데이터센터 협력을 발표하며, 최신 오픈 가중치 모델을 한국에 도입 - 스위스, EU, 영국 등도 공공 중심 오픈소스 AI 정책 및 프로젝트 확대 * 스위스의 Swiss AI 이니셔티브와 EU 지원 프로젝트들도 한국과 유사한 방향성을 가짐 * 영국의 “공공 자금으로 개발된 것은 공공 코드로 공개해야 한다(public money, public code)” 원칙 역시 정부 주도 AI 프로젝트에 영향을 미치고 있음 |
- 오픈소스 및 오픈 가중치 AI에 대한 투자는 실제 활용으로 이어지며, 자체적인 AI 학습 생태계를 갖춘 국가에서는 모델과 데이터셋이 주로 해당 지역에서 더 많이 활용되는 경향이 나타남
* 개발자들은 자신의 언어를 더 잘 반영하고, 유사한 기술적 요구와 활용 환경을 충족하는 모델을 선택하는 경향이 있기 때문
▶ 기업 참여 확대와 오픈소스 활용 증가
○ 대기업과 스타트업 포함 더 많은 기업들이 오픈소스를 기반으로 개발을 확대하고 있음
- Fortune 500 기업 중 30% 이상이 허깅페이스에 참여
- NVIDIA, Meta, Google 등 주요 빅테크 기업의 저장소는 지속적으로 증가
- Airbnb와 같은 기존 미국 기업들도 오픈소스 생태계 참여를 확대하고 있으며, 2025년 동안 기존 기업들의 조직 단위 구독 확대 추세
- 스타트업들은 오픈 모델을 기본 구성 요소로 사용하는 경우가 많아지고 있음
* Thinking Machines의 Tinker 모델 옵션은 전적으로 오픈 가중치 기반으로 구축했으며, VSCode, Cursor와 같은 인기 IDE는 오픈 모델과 클로즈드 모델을 모두 지원
▶ 모델의 인기
○ 지난 1년 동안, Hugging Face Hub에서 가장 많은 ‘좋아요’를 받은 모델은 Meta의 Llama 계열을 중심으로 한 미국 중심 구도에서, 중국의 DeepSeek-R1이 최상위에 위치하는 보다 국제적인 구성으로 변화
* Hub에서 가장 많은 ‘좋아요’를 받은 모델은 커뮤니티의 관심도를 보여주는데, 이 지표가 실제 사용량을 반영하는 것은 아님
▶ 모델 활용 방식 변화와 파생 생태계 확대
○ 모델은 단일 결과물이 아니라 재사용·변형되는 구조, 즉 파인튜닝, 병합, 재배포 등을 통한 모델 확장 구조를 형성하여 활용되고 있음
- Alibaba는 Google과 Meta를 합친 것보다 더 많은 파생 모델을 보유하고 있는데 Alibaba Qwen 계열만으로도 11만 개 이상 파생 모델이 존재하며, Qwen 태그가 포함된 관련 모델 포함 시 20만 개 이상으로 확대
* 이러한 파생 모델은 커뮤니티가 모델을 기반으로 어떻게 확장하는지, 해당 모델의 인기와 활용도가 어느 정도인지를 반영
▶ 기술 흐름 : 소형 모델 중심 활용과 효율성 강화
○ 모델 개발은 규모 중심에서 벗어나 접근성과 효율성을 중시하는 방향으로 변화하고 있음
- 소형 모델이 대형 모델 대비 더 높은 다운로드 및 배포 비율을 보이는데, 비용, 지연 시간(latency), 하드웨어 제약 등 실용적 요인이 반영된 것으로 분석
- 자동화 시스템 및 CI 파이프라인 등에서 소형 모델 활용이 증가하면서 실제 배포 중심의 활용 구조가 확대
- 모델 수 자체가 소형에 더 많이 출시되고 있지만, 이를 보정하더라도 1~9B 모델이 100B 이상 모델 대비 약 4배 높은 채택률을 기록(ATOM(American Truly Open Models) 프로젝트 상대적 채택 지표(RAM, Relative Adoption Metric) 데이터 기준)
○ 모델 규모 확장은 효율화 기술에 의해 이루어지며, 소형 모델 활용 기반은 유지됨
- 양자화 및 MoE(Mixture-of-Experts) 구조 확산으로 다운로드된 모델의 평균 크기는 2023년 8.27억에서 2025년 208억 파라미터로 증가
- 모델 평균 크기는 증가하였으나 중앙값은 3.26억에서 4.06억 파라미터로 소폭 증가에 그쳐 일부 고성능 모델과 함께 소형 모델 활용이 지속되는 구조
○ 소형 및 중형 모델은 다양한 실제 업무 영역에서 활용되며 성능 격차는 축소되는 추세이며, 다양한 모델 크기 전략과 엣지 중심 활용 구조가 확대되는 흐름임
- 검색, 태깅, 문서 처리 등은 수억 단위 모델로 충분히 수행되며, 수십억 단위 모델은 코딩, 추론, 멀티모달 작업에 폭넓게 활용됨
- 파인튜닝 및 태스크 특화 최적화를 통해 대형 모델과의 성능 차이가 빠르게 축소되고 있음
- 주요 모델 개발 기업들은 다양한 크기의 모델 라인업을 동시에 제공하는 전략을 채택
- 뛰어난 성능을 갖춘 소형 모델의 등장으로 자율성이 엣지 컴퓨팅 영역으로 이동하고 중앙 집중식 클라우드의 의존도가 감소하고 있음
○ 오픈 모델의 활용은 출시 직후 집중되고 빠르게 감소하는 단기 사이클을 보임
- 오픈 모델에 대한 관심은 출시 직후 정점에 도달한 후 점차 감소하는 패턴을 보이며, 평균 활용 지속 기간은 약 6주 수준으로 나타남
- 지속적인 성능 개선과 빈번한 업데이트가 모델 경쟁력 유지에 중요한 요소로 작용
* DeepSeek은 V3, R1, V3.2 등 연속적인 업데이트를 통해 경쟁력을 유지한 사례가 있음
▶ 인프라와 하드웨어 환경 변화
○ 오픈소스 AI는 하드웨어 환경과 밀접하게 연결되며 다양한 플랫폼 지원이 확대되고 있음
- 대부분의 모델은 NVIDIA GPU에 최적화되어 있지만, AMD 하드웨어에 대한 지원도 계속 확대되고 있음
- 중국 오픈 모델들은 자국 칩을 명시적으로 지원하는 구조로 발전
- 2025년 Hugging Face는 NVIDIA와 AMD GPU에 최적화된 커널을 로드하고 실행할 수 있는 Kernel Hub를 출시
- AI 모델의 개발과 배포 전반에서 컴퓨팅 자원 접근성은 여전히 핵심적인 요소임
- 오픈소스 및 오픈 가중치 모델은 대규모 컴퓨팅 자원에 의존하는 기존 AI 개발 구조에서 점차 벗어나는 흐름을 보임
- 다양한 성능 수준의 모델 등장으로 고성능 인프라 의존도가 완화되고 모델 효율성 개선을 통해 비용이 최대 10배~1000배까지 절감되는 방향으로 발전
- 다만, 대형 폐쇄형 모델 기업이 보유한 컴퓨팅 자원과 오픈소스 커뮤니티가 접근 가능한 자원 간 격차가 지속적으로 존재하는데, 이 격차는 오픈소스 개발에서 가능한 범위를 계속해서 제한하는 구조적 요인으로 작용하고 있음
- 오픈소스를 위한 인프라 투자 문제는 여전히 중요한 과제로 남아 있음
* 특히, 유럽과 영국에서 오픈 모델을 학습·서빙할 수 있는 데이터센터에 대한 공공 투자 필요성이 중요한 정책 이슈로 부상하고 있음
▶ 확장 영역: 로보틱스와 과학 분야 성장
○ 오픈소스 AI는 언어 및 이미지 영역을 넘어 물리·과학 분야로 확장되고 있음
① Hugging Face에서 가장 빠르게 성장 중인 ‘로보틱스’
- 로보틱스 데이터셋 수가 1,145개에서 26,991개로 급증하며 Hugging Face 내 최대 데이터셋 카테고리로 성장
* 로보틱스는 3년 만에 44위에서 가장 큰 데이터셋 카테고리로 성장했으며, 두 번째로 큰 카테고리인 텍스트 생성은 2025년에 약 5,000개 수준에 머물러 있음
- 커뮤니티가 기여한 데이터셋은 가정용 조작 작업부터 자율주행까지 다양한 영역을 포함하고 있음
- 공간 지능(spatial intelligence)을 위한 가장 큰 멀티모달 데이터셋인 Learning to Drive (L2D)는 LeRobot과 Yaak의 협업을 통해 공개
- Hugging Face의 오픈소스 로보틱스 라이브러리인 LeRobot은 PyTorch 기반으로 실제 로봇 환경을 위한 모델, 데이터셋, 도구를 제공하며, 모방 학습(imitation learning), 강화 학습(reinforcement learning), 비전-언어-행동 모델을 포함
* 이 라이브러리는 지난 1년 동안 GitHub 저장소의 스타 수가 거의 3배 증가하며 빠르게 성장 중
- RoboMIND와 같은 데이터셋은 479개의 서로 다른 작업과 다양한 로봇 형태에 걸쳐 107,000개 이상의 실제 환경 경로 데이터를 포함하고 있으며, 이는 일반화 가능한 로봇 정책을 학습하기 위해 필요한 규모와 다양성을 제공
② 매우 활발한 영역으로 부상중인 ‘과학 분야 AI (AI for Science)’
- 과학 분야에서 오픈 모델과 데이터셋은 단백질 구조 예측, 분자 동역학, 신약 개발, 과학 데이터 분석 등 다양한 분야에서 활용이 확대되고 있음
- 커뮤니티 주도의 프로젝트들은 공통의 연구 목표를 중심으로 형성되고 있으며, 종종 수백 명의 기여자가 여러 기관과 학문 분야에 걸쳐 협력하고 있음
- 이러한 노력은 오픈소스가 전통적인 학계나 기업 구조만으로는 조직하기 어려운 대규모, 다학제 협업을 조율하는 중요한 메커니즘으로 작용하고 있음을 보여줌
□ 시사점
○ 오픈소스 AI 생태계는 규모 확대와 함께 글로벌 참여, 기술의 특화, 제도적 채택이 결합되면서 계속 진화하고 있음
○ 파생 모델 생태계가 확대됨에 따라, 모델이 재학습파인튜닝될 경우 원본 모델의 라이선스 조건이 파생 모델에도 그대로 적용되며, 추가 학습 데이터의 라이선스까지 중첩될 수 있어 라이선스 준수 관리의 복잡성이 증가할 수 있어 주의가 필요
□ 주목할 만한 월간 이슈(4월)
○ (개방형 AI 생태계) 엔비디아, 네이버, LG AI연구원, SK텔레콤 등 K-AI 기업과 '개방형 AI 생태계' 확장 논의
- 엔비디아가 네이버클라우드, LG AI연구원, SK텔레콤 등 국내 주요 AI 기업들과 협력하며 한국 AI 생태계 공략
- 엔비디아는 한국 특화 합성 데이터셋 ‘네모트론 페르소나 코리아’를 허깅페이스에 상업적 활용이 가능한 형태로 공개
* 이 데이터셋은 국가통계포털(KOSIS), 대법원, 국민건강보험공단 등 공공 데이터를 기반으로 구축됐으며, 네이버클라우드가 설계 단계부터 기초 데이터와 도메인 지식을 제공하며 개발
- 이번 협력은 엔비디아가 단순한 하드웨어 공급을 넘어, 국가별 데이터셋과 오픈 AI 생태계를 기반으로 지역 맞춤형 AI 플랫폼 전략을 강화하는 움직임으로 해석
- 네이버클라우드는 한국어 특화 데이터와 최적화 기술을 기반으로 협력에 참여했으며, 학습 속도를 10% 이상 높인 저정밀 연산 기법 등 기술 개선안도 제안
* 브라이언 카탄자로 엔비디아 응용연구 총괄 부사장은 네이버 1784 사옥을 방문해 네이버클라우드와 ‘네모트론(Nemotron)’의 국내 확산 및 ‘하이퍼클로바X’ 후속 모델 고도화 방안을 논의
* ‘네모트론'은 엔비디아에서 개발한 대규모 언어 모델(LLM) 시리즈로 단순한 모델을 넘어, 에이전틱 AI시스템 구축에 특화된 모델·데이터셋·기술 스택 전체를 포함
- LG AI연구원은 네모트론 오픈 에코시스템을 활용한 전문 분야 특화 모델 공동 개발에 합의
- SK텔레콤도 차세대 AI 모델인 ‘A.X K2’ 개발 과정에서 엔비디아의 데이터셋과 최신 솔루션을 적극 도입해 활용 중
- 업스테이지, 엘리스그룹, 모티프테크놀로지스 등 유망 AI 스타트업들도 엔비디아와의 파트너십을 통해 인프라 및 모델 개발 협력을 강화하는 중
○ (오픈소스 행사) 리눅스재단, 오는 8월 한국 서울서 '오픈소스 서밋'개최
- 리눅스재단이 오는 8월 11일부터 12일까지 서울에서 '오픈소스 서밋 코리아(OpenSource Summit Korea)'를 개최 예정
* 오픈소스 서밋 행사는 클라우드를 비롯한 리눅스, 인공지능(AI), 데이터 등 여러 오픈소스 기술 분야를 아우르는 글로벌 컨퍼런스
* 오픈소스 서밋 행사는 지난해 처음으로 한국에서 열렸으며, 짐 젬린 리눅스재단 의장을 비롯해 리누스 토르발스 리눅스/깃 창시자, 그렉 크로아-하트먼 리눅스 커널 유지관리 책임자가 연사로 참여했으며, 국내에선 하정우 대통령실 AI미래기획수석비서관, 안재석 kt클라우드 기술본부장 등이 연설했음
- 이번 행사는 클라우드·오케스트레이션, 임베디드 시스템, 오픈소스 AI 모델·데이터, 컨테이너, 보안 소프트웨어를 다루며 최신 오픈소스 기술 트렌드와 산업 적용 사례도 공유될 예정
○ (AI 에이전트) '에이전틱 AI 얼라이언스' 출범…산·학·연·관 협력 강화
- 에이전틱 AI 생태계의 기반이 될 오픈소스 프런티어 모델을 공동으로 만들기 위해 글로벌 AI 기업 8개사와 함께 ‘네모트론 연합’ 출범
* 블랙 포레스트 랩스·커서·랭체인·미스트랄 AI·퍼플렉시티·리플렉션 AI·사르밤·싱킹 머신스 랩 등 8개사가 창립 멤버로 참여
- 연합의 첫 프로젝트는 미스트랄 AI와 엔비디아가 공동 개발하는 베이스 모델이며, 나머지 멤버들은 각자의 데이터·평가 프레임워크·전문성으로 사후 훈련과 지속적 개발을 지원
- 완성 모델은 엔비디아 DGX 클라우드에서 훈련돼 오픈소스로 공개되며, 향후 ‘네모트론 4’ 모델 제품군의 기반이 될 예정
- 기업 환경에서 오픈소스 AI 모델의 안전한 배포를 위해, 엔비디아는 보안·거버넌스 기능을 통합한 ‘네모클로’ 오픈소스 스택을 공개
* 오픈클로 플랫폼 기반에서 네모트론 모델과 ‘오픈쉘’을 단일 명령어로 설치·운영 가능
○ (로봇) 로보티즈, 휴머노이드 'AI 사피엔스' 프로토타입 공개
- 로보티즈가 신규 액추에이터 ‘다이나믹셀-Q’를 탑재한 휴머노이드 ‘AI 사피엔스’ 프로토타입을 공개
* AI 사피엔스는 단일 하드웨어만으로 보행, 질주, 댄스, 외발서기 등 다양한 동작을 수행할 수 있는 점이 특징으로 핵심 부품인 다이나믹셀-Q는 준직구동(QDD) 방식으로 강한 힘, 정밀 제어, 외부 충격 흡수, 부드러운 움직임을 구현
- 로보티즈는 연구자와 개발자가 활용할 수 있도록 메인 제어기의 소스코드를 공개했으며, 여기에는 AI 로봇의 움직임을 배우고 실행하게 만드는 학습 모델·데이터셋·도구 등이 포함
- 이를 통해 휴머노이드 개발 진입장벽을 낮추고, 다이나믹셀-Q 기반의 K-로봇 생태계를 확대하겠다는 계획
○ (AI 디자인) 구글, 디자인 시스템 플랫폼 스티치 핵심 포맷 ‘DESIGN md’ 오픈소스로 공개
- 구글은 디자인 시스템 플랫폼 스티치(Stitch)에서 사용하던 핵심 포맷 ‘DESIGN.md’를 오픈소스로 공개
* DESIGN.md는 색상, 타이포그래피, 레이아웃 같은 디자인 규칙뿐 아니라 각 요소의 의도와 맥락까지 문서화해 프로젝트 간 재사용과 확장을 쉽게 하는 것이 특징
- AI가 단순히 디자인 형태를 따라 하는 것을 넘어 브랜드 정체성, 사용자 행동 유도 목적, 접근성 기준 등을 이해하고 더 일관된 UI를 생성
- 색상 대비, 가독성, UI 구조 등을 자동으로 검증해 WCAG 등 접근성 기준 충족에도 도움을 줄 수 있음
- 구글은 이를 특정 도구에 종속되지 않는 오픈소스 포맷으로 공개해 디자이너·개발자 협업과 AI 기반 UI 디자인 표준화를 강화하려는 전략으로 풀이됨
○ (바이오·생명공학) 오픈프로틴AI, 연구자 위한 노코드 단백질 설계 플랫폼 지원
- MIT 출신 이 창업한 오픈프로틴AI(OpenProtein.AI)는 단백질 공학을 위한 파운데이션 모델과 다양한 도구를 제공하는 플랫폼을 통해 생명과학자들이 AI 기술을 보다 쉽게 활용할 수 있도록 오픈소스로 지원
- 핵심 기술인 단백질 언어모델 ‘포엣(PoET)’은 단백질 군 데이터를 학습해 진화적 제약을 반영한 단백질 서열 라이브러리 생성과 후보 검증을 돕고, 실험 비용과 시간을 줄이는 데 기여
- 최신 모델 ‘포엣-2(PoET-2)’는 적은 컴퓨팅 자원과 데이터로도 높은 성능을 구현해 효율성과 확장성을 높였으며, 플랫폼은 웹 기반 노코드 환경과 API를 함께 제공
- 현재 제약 및 바이오 기업은 물론 학계 연구자들에게도 사전 신청을 통해 해당 플랫폼(https://www.openprotein.ai/early-access-form)을 제공
○ (영상) 넷플릭스도 영상 AI 모델 'VOID' 내놨다...오픈소스로 제공
- 넷플릭스와 소피아대 연구진은 영상에서 특정 물체를 삭제하고, 해당 물체가 없었을 경우 주변 장면이 어떻게 변화했을지까지 자연스럽게 생성하는 비전-언어 모델 ‘VOID(Video Object and Interaction Deletion)’를 공개
- VOID는 단순 인페인팅을 넘어 충돌, 낙하, 물 튀김 등 삭제된 객체가 주변 환경에 미친 물리적 영향을 함께 제거·재구성해 더 자연스러운 영상 복원을 지원
* 예를 들어 차량 충돌 영상에서 차량 한 대를 제거하면 잔해·연기·화염까지 없애고 남은 차량이 도로를 주행하는 장면으로 바꾸며, 수영장에 뛰어드는 사람을 제거하면 물이 튀지 않은 조용한 장면처럼 생성
- 연구진은 설문에서 VOID가 64.8% 선호도를 기록해 기존 도구인 Runway보다 높은 평가를 받았으나 40GB 이상 VRAM이 필요해 일반 사용자보다는 전문 제작 환경에 적합한 것으로 분석됨
- 넷플릭스가 처음 공개한 오픈소스 AI 모델로, 아파치 2.0 라이선스로 배포돼 상업적 활용도 가능하며 허깅페이스 등을 통해 공개