[6월 월간브리핑]AI 코드제너레이터와 오픈소스 저작권 분쟁 : 라이선스 검증 필수
support
게시글 작성 시각 2023-06-26 18:14:40
AI 코드제너레이터와 오픈소스 저작권 분쟁 : 라이선스 검증 필수 외
- Open UP -
- AI 코드제너레이터의 오픈소스 저작권 분쟁으로 라이선스 검증의 중요성 재조명
- 지난 5월, 미국 법원은 AI 코딩 도구인 GitHub Copilot의 저작권법 및 오픈소스 라이선스 위반에 대한 소송의 각하 신청(Motion to Dismiss) 기각
- 이 소송은 라이선스 조건 준수 없이 오픈소스 코드 사용에 대한 우려를 제기, LLM에 기반한 AI 코드제너레이터 도구를 업무에 사용하려는 기업들은 필수적으로 라이선스 검증 진행 필요
- 국내 최대 ‘공개SW 도전의 장’, 제17회 공개SW 개발자대회 오는 7월 20일까지 참가자 모집
- 프로젝트 기획, 개발, 구현, 협업 등의 개발 경험과 기능테스트, 라이선스 검증 등 공개SW의 전반적인 개발 과정을 경험
□ AI 코드제너레이터의 오픈소스 라이선스 위반 소송으로 라이선스 검증의 중요성 부각
- 지난 5월, 미국 캘리포니아주 북부 지방법원은 AI 코딩 도구의 저작권법 및 오픈소스 라이선스 위반에 대한 소송 청구를 지속할 수 있도록 허용
- 지난해 11월 AI 코딩 도구인 GitHub Copilot이 허가 없이 GitHub의 공개 리포지토리에서 코드를 사용하여 저작권법 및 오픈소스 라이선스를 위반했다고 OpenAI, Microsoft 및 GitHub를 상대로 저작권 집단 소송 제기
- * 집단소송 : 일부 당사자가 제기하지만, 결과가 동일한 이해관계를 가진 사람 모두에게 적용되는 소송제도
- * 이 소송의 원고 측 주장은 Copilot을 학습시키기 위해 GitHub의 리포지토리의 오픈소스 코드를 사용했으며 이는 미국의 디지털 밀레니엄 저작권법 제1202조 등의 위반 및 오픈소스 라이선스 고지의무 및 공개의무 위반이라고 주장
- * 2022년 6월 Copilot의 사용자 수는 120만명이었며 각 사용자가 디지털 밀레니엄 저작권법 제1202조항을 위반하는 결과물을 한번만 받았다고 가정하더라도 무려 36,000번을 위반, 이를 법적 손해배상액으로 환산하면 무려 90억 달러에 이를 것으로 추산됨
- OpenAI 등은 반박 의견서를 제출하며 이 소송의 각하 신청(Motion to Dismiss)을 요청하였으나 법원은 이를 기각
- * 각하 신청(Motion to Dismiss) : 미국의 법적 절차 중 하나로, 소송이 제기된 후, 피고가 원고의 소송을 기각해 달라는 요청을 법원에 하는 것
- * OpenAI 등은 GitHub 레포지토리의 여러 오픈소스가 학습에 사용된 것은 사실이나 초거대 AI 학습 모델(LLM, Large Language Models)의 생성 및 발전 등 기술 발전을 위한 공정이용에 해당한다고 주장하였으며,
- * 출력물에 있어서는 라이선스가 부가된 오픈소스 코드가 직접적으로 사용된 것이 아니고 LLM의 학습 결과에 따라 새로 생성된 신규 저작물이라고 반박
- 이는 원고가 주장한 저작권법 위반 및 오픈소스 라이선스 계약위반 등에 대한 내용이 받아들여져 소송을 통해 입증할 기회를 갖게 된다는 의미임
- 이 소송은 라이선스 조건 준수 없이 오픈소스 코드를 사용하는 것에 대한 우려를 제기, LLM에 기반한 AI 코드제너레이터 도구를 업무에 사용하려는 기업들은 반드시 라이선스 검증을 필수적으로 진행해야 함
- * 다른 AI 생성 콘텐츠와 마찬가지로 AI 코드제너레이터를 사용하는 기업들은 AI 생성코드에 대해 저작권 및 오픈소스 라이선스 스니펫 검증 포함 등 생성형 AI 사용을 관리하는 새로운 정책 마련 필요
- 지난해 11월 AI 코딩 도구인 GitHub Copilot이 허가 없이 GitHub의 공개 리포지토리에서 코드를 사용하여 저작권법 및 오픈소스 라이선스를 위반했다고 OpenAI, Microsoft 및 GitHub를 상대로 저작권 집단 소송 제기
□ 오픈소스로 확장되는 AI 생태계
- 오픈AI의 챗GPT의 등장으로 생성형 AI 기술을 접목한 기술 개발 가속화 등 다양한 비즈니스 분야로 확대 전망
- (글로벌 AI 시장 규모) '22년 869억달러(약 120조4000억원) 규모로 예상되며 연평균 36.2%의 성장률을 지속해 오는 '27년에는 4,070억달러(약 563조9000억원) 규모로 성장할 것으로 전망(MarketsandMarkets, '23년1월)
- (국내 AI 시장 규모) 국내 AI 시장이 전년 대비 17.2% 성장해 2조6천123억원의 매출 규모를 형성할 것으로 예상되며 향후 5년간 연평균 성장률 14.9%로 '27년까지 4조 4천636억원 규모에 이를 것으로 전망(한국IDC, '23년4월)
- (글로벌 생성형 AI 시장 규모) '22년 113억 달러(약 14조 원)에서 연평균 35.6% 성장해 '27년에는 518억 달러(약 67조 원) 성장 전망(Research And Markets, '23년4월)
- 메타가 라마(LLaMA)를 소스코드를 공개한 후 다양한 AI 모델들이 연이어 등장하면서 LLM의 대중화 현상을 이끄는 오픈소스 진영과 상업화 및 폐쇄 전략을 택한 비오픈소스 진영으로 양분
- 지난해 말 챗GPT를 공개한 오픈AI는 LLM을 기반으로 한 생성형 AI 생태계를 리드하고 마이크로소프트와 협력을 강화하면서 상업화 중심의 운영방식 채택
- 구글 또한 지난 5월 구글 연례 개발자 대회에서 선보인 최신 LLM 팜2(PaLM2)에 대한 기술적 정보를 자세히 공개하지 않음
- 반면, 후발주자 메타는 지난 2월 상업적 이용을 허락하지 않고 연구 목적에 한해 생성형 AI를 만들 수 있는 라마를 오픈소스로 제공
- * 지난 6월 15일, 메타가 상업적인 용도로로 쓸 수 있는 오픈소스 LLM 라마의 차세대 버전을 준비중이라고 보도
- 이미지 생성 AI로 유명한 스태빌리티AI의 '스태이블LM', 미국의 스타트업 허깅페이스의 '블룸(BLOOM)', 데이터브릭스의 '돌리' 등 LLM 모델을 오픈소스로 공개
- 스탠포드대 연구진이 라마를 기반으로 개발한 '알파카'나 UC버클리-스탠포드대 연구진이 함께 개발한 '비쿠냐' 등 소형언어모델(sLLM)도 좋은 평가
- * 구글 내부보고서에 따르면 “구글은 오픈AI와 경쟁하고 있는 것처럼 보이지만 오픈소스 AI 기술이 시장에서 앞서고 있다. 오픈소스 모델은 더 빠르고, 내부용으로 활용하기 더 좋으며, 훨씬 더 뛰어난 성능을 제공한다”라고 분석
- 생성AI 모델의 개발 진입 장벽 낮추겠다는 오픈소스 진영 행보에 탄력받아 오픈AI도 대형 언어 모델(LLM)을 오픈소스로 출시 준비중
- *최근 들어 인공지능(AI) 개발자들 사이의 구글이나 오픈AI 등 고가의 LLM보다는 오픈소스 커뮤니티에서 공유한 기술을 주로 활용하면서 오픈소스 모델 대중화 현상에 편승해 입지를 넓히려는 시도
□ 국내 최대 ‘공개SW 도전의 장’, 제17회 공개SW 개발자대회 참가자 모집
- 과학기술정보통신부 주최 정보통신산업진흥원 주관의 ‘제17회 공개SW 개발자 대회’가 7월 20일까지 참가자 모집
- 올해로 17회째를 맞는 국내 최대의 규모의 ‘공개SW 도전의 장’인 이번 대회는 창의적인 공개SW 개발자 양성을 위해 최종 21개팀을 선발, 총상금 6,400만원을 지원하며 대상으로 과학기술정보통신부장관상 수여
- 공개SW에 관심 있는 국민이라면 누구나 참여할 수 있으며, 참가자는 프로젝트 기획, 개발, 구현, 협업 등의 개발 경험과 기능테스트, 라이선스 검증 등 공개SW의 전반적인 개발 과정을 경험
- 참가자들은 제공된 교육 자료를 학습하고, 자율적 개발을 거쳐 오는 9월 7일까지 출품작 제출
- * 1차 평가를 통해 1차 합격팀 선발, 결선 진출작에 대해서는 1개월간의 맞춤형 팀별 멘토링을 제공하여 개발역량 향상, 출품작의 고도화 기간을 갖게 되며 2차 평가를 거쳐 최종 수상작 선정
- 개발 주제는 인공지능(AI), 빅데이터, 클라우드, 사물인터넷, 블록체인 등 자유 과제와 공개SW 기업이 지정하는 과제(개방형OS, 클라우드 등), 환경/생활/안전/교육 등 사회문제 해결을 위한 과제, 이전 출품작의 성능향상을 위한 프로젝트 향상과제 등 4개 부문으로 구성
- ※ 자세한 내용은 공개SW 포털 내 개발자대회 페이지(https://www.oss.kr/dev_competition) 참조
□ 주목할 만한 월간 이슈(6월)
- (SBOM) 과기정통부, SBOM 생성 법제화 추진
- 과학기술정보통신부가 소프트웨어 공급망 보안대책의 일환으로 SBOM(SW 명세서) 생성 법제화 추진
- 국내 SW기업들의 해외진출을 체계적으로 지원하기 위해 SBOM 생성 법제화 필요성을 제기
- * 정부가 SBOM 생성 법제화를 추진하는 이유는 솔라원즈, 로그4j 등 최근 몇년간 발생한 SW 공급망 공격 사례 때문이며 SW 공급망이 공격을 받게 되면 공급망을 통해 해당 SW 이용자들도 같은 공격을 받게 돼 피해가 상당히 커지기 때문임
- 올해 약 10억원의 예산을 투입하여 3개 기업에서 SBOM 실증사업을 진행, 기업의 부담을 줄이기 위한 자동화 솔루션 개발에 착수
- * SBOM 생성 플랫폼 구축 후 산업별 특성에 따른 DB(데이터베이스) 취약점 등을 수집하고 개발자들이 달라진 환경에서 느끼는 부담도 파악할 예정
- 정부는 SBOM으로 인한 기업 부담을 최소화하면서 법제화시킬 방안 모색중
- (AI) 메타, AI 음악 생성기 ‘뮤진젠’ 오픈소스로 공개
- 메타가 원하는 음악 스타일을 자연어로 입력하면 음악을 생성해 주는 기술 ‘뮤직젠(MusicGen)’을 오픈소스로 공개
- * 뮤직젠 데모 페이지를 살펴보면 한쪽에는 음악 스타일을 적고 다른 한쪽에는 샘플 음악 파일을 업로드하면 이를 참고해 약 10초분량의 음악 생성
- 뮤직젠은 2만 시간 분량의 음악 데이터를 학습하였으며 코드는 MIT 라이선스 하에, 모델은 CC-BY-NC 라이선스 하에 공개
- * 학습 데이터에는 저작권 문제가 없는 고음질 음악 파일 1만 개와 악기 소리만 담은 음악 39만 개 파일이 포함되었으며 음악 저작권 소유 및 관리 기업인 셔터스톡(ShutterStock)과 폰드5(Pond5)와 협업
- 메타가 원하는 음악 스타일을 자연어로 입력하면 음악을 생성해 주는 기술 ‘뮤직젠(MusicGen)’을 오픈소스로 공개
- (반도체) 삼성전자, 첨단 반도체 생태계 구축 및 확산을 위한 'RISC-V' 오픈소스SW 개발 프로젝트 참여
- 리눅스재단이 발족한 오픈소스SW 개발 프로젝트 'RISE(RISC-V Software Ecosystem)'의 운영 이사회 멤버로 참여
- * RISE는 오픈소스 반도체 설계자산(IP, Intellectual Property)인 'RISC-V(리스크 파이브)'를 활용한 소프트웨어를 개발하기 위해 출범한 조직으로 삼성전자를 포함해 구글, 인텔, 엔비디아, 퀄컴 등 글로벌 IT·반도체 업체들이 참여
- 삼성전자 등 이번 RISE 프로젝트에 참여한 기업들은 RISC-V를 기반으로 한 소프트웨어를 공동 개발할 예정
- * RISC-V는 특정기업이 소유권을 갖지 않기 때문에 이를 활용한 소프트웨어가 개발되면 어떤 기업이든 무료로 반도체를 설계하는 데 활용할 수 있어 관련 생태계 확장에크게 기여할 것으로 예상
- 향후 모바일/가전/데이터센터/차량용 애플리케이션 등 다양한 분야에 활용될 것으로 기대
- 리눅스재단이 발족한 오픈소스SW 개발 프로젝트 'RISE(RISC-V Software Ecosystem)'의 운영 이사회 멤버로 참여
- (모빌리티) 테슬라 전기차 운영체제 오픈소스화 제안
- 테슬라가 전기차 운영 시스템의 코드 일부를 다른 자동차 제조업체에 공개할 수 있다고 제안
- 테크크런치 등 외신에 따르면, 일론 머스크 CEO는 이날 트위터를 통해 짐 팔리 포드 CEO와 가진 대담을 통해 "안드로이드가 일종의 일반 표준으로 휴대폰 업계에 도움이 되는 것처럼, 잠재적으로 더 많은 코드를 오픈소스화할 수 있을 것"이라고 언급
- 테슬라 전기차OS를 오픈소스로 공개한다면, 안드로이드를 기반으로 자동차 운영체제를 개발한 구글은 물론 애플과도 경쟁 구도를 이룰 것으로 예상
□ 시사점
- 이번 AI 코딩 도구의 오픈소스 라이선스 및 저작권 소송은 인공지능의 공정이용에 대한 명확한 기준이 마련되고 오픈 소스 개발자의 권리를 보호하는 데도 도움이 될 것으로 기대
- 개발자 대회는 정부의 지속적인 정책적 지원으로 국내 오픈소스SW 시장을 한단계 성장시키고 오픈소스SW 개발자의 저변확대에 기여
※ 참고 Reference
- Breach of Open-Source License Claim Against AI Coding Assistant May Continue, Court Says, National Law Review, 2023.06.15.
https://www.natlawreview.com/article/breach-open-source-license-claim-against-ai-coding-assistant-may-continue-court-says - GitHub, Microsoft, and OpenAI Face Legal Battle as Copilot Copyright Lawsuit Continues , WinBuzzer News, 2023.05.12.
https://winbuzzer.com/2023/05/12/github-microsoft-and-openai-face-legal-battle-as-copilot-copyright-lawsuit-continues-xcxwbn/ - MS·깃허브·오픈AI, 법원에 AI 저작권 소송 각하 요청, ZDNet Korea, 2023.01.30.
https://zdnet.co.kr/view/?no=20230130092010 - Microsoft, GitHub and OpenAI Accused of Software Piracy, Sued for $9B in Damages, Spiceworks, 2022.12.16.
https://www.spiceworks.com/tech/artificial-intelligence/news/github-copilot-class-action-lawsuit/ - [기고] 생성형AI 개발도구 Copilot의 오픈소스 라이선스 위반과 저작권 분쟁, Open UP, 2023.06.26.
https://www.oss.kr/oss_guide/show/edcf990f-38e7-4918-8c91-d989babf3c09 - [기획] 생성형 AI 시대, 새로운 전략 도구 오픈소스, Open UP, 2023.06.26.
https://www.oss.kr/oss_guide/show/648e0034-b7aa-42f1-b060-836c0855a0b8 - 제2의 솔라윈즈 사태 막는다…SBOM 생성 법제화 추진, 머니투데이, 2023.06.08.
https://news.mt.co.kr/mtview.php?no=2023060813394653791 - AI 음악 경쟁 본격화…메타, AI 음악 생성기 ‘뮤진젠’ 오픈소스로 공개, CIO Korea, 2023.06.13.
https://www.ciokorea.com/news/294331 - 삼성전자, 'RISC-V' 오픈소스SW 개발 프로젝트 이사회로 참여, ZDNet Korea, 2023.06.01.
https://zdnet.co.kr/view/?no=20230601081835 - 일론 머스크, 테슬라 전기차 운영체제 오픈소스화 제안, Disital Today, 2023.05.26.
https://www.digitaltoday.co.kr/news/articleView.html?idxno=477591 - 공개SW 포털(oss.kr) ‘공개SW 소식’ 참조
Open UP에 의해 작성된 이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다.
.
.
2023
0개 댓글