본문 바로가기

 

AI 코드제너레이터와 오픈소스 저작권 분쟁 : 라이선스 검증 필수 외

- Open UP -

 

  • AI 코드제너레이터의 오픈소스 저작권 분쟁으로 라이선스 검증의 중요성 재조명
    1. 지난 5월, 미국 법원은 AI 코딩 도구인 GitHub Copilot의 저작권법 및 오픈소스 라이선스 위반에 대한 소송의 각하 신청(Motion to Dismiss) 기각
    2. 이 소송은 라이선스 조건 준수 없이 오픈소스 코드 사용에 대한 우려를 제기, LLM에 기반한 AI 코드제너레이터 도구를 업무에 사용하려는 기업들은 필수적으로 라이선스 검증 진행 필요
  • 국내 최대 ‘공개SW 도전의 장’, 제17회 공개SW 개발자대회 오는 7월 20일까지 참가자 모집
    1. 프로젝트 기획, 개발, 구현, 협업 등의 개발 경험과 기능테스트, 라이선스 검증 등 공개SW의 전반적인 개발 과정을 경험

 

□ AI 코드제너레이터의 오픈소스 라이선스 위반 소송으로 라이선스 검증의 중요성 부각

  • 지난 5월, 미국 캘리포니아주 북부 지방법원은 AI 코딩 도구의 저작권법 및 오픈소스 라이선스 위반에 대한 소송 청구를 지속할 수 있도록 허용
    1. 지난해 11월 AI 코딩 도구인 GitHub Copilot이 허가 없이 GitHub의 공개 리포지토리에서 코드를 사용하여 저작권법 및 오픈소스 라이선스를 위반했다고 OpenAI, Microsoft 및 GitHub를 상대로 저작권 집단 소송 제기
      1. * 집단소송 : 일부 당사자가 제기하지만, 결과가 동일한 이해관계를 가진 사람 모두에게 적용되는 소송제도
      2. * 이 소송의 원고 측 주장은 Copilot을 학습시키기 위해 GitHub의 리포지토리의 오픈소스 코드를 사용했으며 이는 미국의 디지털 밀레니엄 저작권법 제1202조 등의 위반 및 오픈소스 라이선스 고지의무 및 공개의무 위반이라고 주장
      3. * 2022년 6월 Copilot의 사용자 수는 120만명이었며 각 사용자가 디지털 밀레니엄 저작권법 제1202조항을 위반하는 결과물을 한번만 받았다고 가정하더라도 무려 36,000번을 위반, 이를 법적 손해배상액으로 환산하면 무려 90억 달러에 이를 것으로 추산됨
    2. OpenAI 등은 반박 의견서를 제출하며 이 소송의 각하 신청(Motion to Dismiss)을 요청하였으나 법원은 이를 기각
      1. * 각하 신청(Motion to Dismiss) : 미국의 법적 절차 중 하나로, 소송이 제기된 후, 피고가 원고의 소송을 기각해 달라는 요청을 법원에 하는 것
      2. * OpenAI 등은 GitHub 레포지토리의 여러 오픈소스가 학습에 사용된 것은 사실이나 초거대 AI 학습 모델(LLM, Large Language Models)의 생성 및 발전 등 기술 발전을 위한 공정이용에 해당한다고 주장하였으며,
      3. * 출력물에 있어서는 라이선스가 부가된 오픈소스 코드가 직접적으로 사용된 것이 아니고 LLM의 학습 결과에 따라 새로 생성된 신규 저작물이라고 반박
    3. 이는 원고가 주장한 저작권법 위반 및 오픈소스 라이선스 계약위반 등에 대한 내용이 받아들여져 소송을 통해 입증할 기회를 갖게 된다는 의미임
    4. 이 소송은 라이선스 조건 준수 없이 오픈소스 코드를 사용하는 것에 대한 우려를 제기, LLM에 기반한 AI 코드제너레이터 도구를 업무에 사용하려는 기업들은 반드시 라이선스 검증을 필수적으로 진행해야 함
      1. * 다른 AI 생성 콘텐츠와 마찬가지로 AI 코드제너레이터를 사용하는 기업들은 AI 생성코드에 대해 저작권 및 오픈소스 라이선스 스니펫 검증 포함 등 생성형 AI 사용을 관리하는 새로운 정책 마련 필요

 

□ 오픈소스로 확장되는 AI 생태계

  • 오픈AI의 챗GPT의 등장으로 생성형 AI 기술을 접목한 기술 개발 가속화 등 다양한 비즈니스 분야로 확대 전망
    1. (글로벌 AI 시장 규모) '22년 869억달러(약 120조4000억원) 규모로 예상되며 연평균 36.2%의 성장률을 지속해 오는 '27년에는 4,070억달러(약 563조9000억원) 규모로 성장할 것으로 전망(MarketsandMarkets, '23년1월)
    2. (국내 AI 시장 규모) 국내 AI 시장이 전년 대비 17.2% 성장해 2조6천123억원의 매출 규모를 형성할 것으로 예상되며 향후 5년간 연평균 성장률 14.9%로 '27년까지 4조 4천636억원 규모에 이를 것으로 전망(한국IDC, '23년4월)
    3. (글로벌 생성형 AI 시장 규모) '22년 113억 달러(약 14조 원)에서 연평균 35.6% 성장해 '27년에는 518억 달러(약 67조 원) 성장 전망(Research And Markets, '23년4월)
  • 메타가 라마(LLaMA)를 소스코드를 공개한 후 다양한 AI 모델들이 연이어 등장하면서 LLM의 대중화 현상을 이끄는 오픈소스 진영과 상업화 및 폐쇄 전략을 택한 비오픈소스 진영으로 양분
    1. 지난해 말 챗GPT를 공개한 오픈AI는 LLM을 기반으로 한 생성형 AI 생태계를 리드하고 마이크로소프트와 협력을 강화하면서 상업화 중심의 운영방식 채택
    2. 구글 또한 지난 5월 구글 연례 개발자 대회에서 선보인 최신 LLM 팜2(PaLM2)에 대한 기술적 정보를 자세히 공개하지 않음
    3. 반면, 후발주자 메타는 지난 2월 상업적 이용을 허락하지 않고 연구 목적에 한해 생성형 AI를 만들 수 있는 라마를 오픈소스로 제공
      1. * 지난 6월 15일, 메타가 상업적인 용도로로 쓸 수 있는 오픈소스 LLM 라마의 차세대 버전을 준비중이라고 보도
    4. 이미지 생성 AI로 유명한 스태빌리티AI의 '스태이블LM', 미국의 스타트업 허깅페이스의 '블룸(BLOOM)', 데이터브릭스의 '돌리' 등 LLM 모델을 오픈소스로 공개
    5. 스탠포드대 연구진이 라마를 기반으로 개발한 '알파카'나 UC버클리-스탠포드대 연구진이 함께 개발한 '비쿠냐' 등 소형언어모델(sLLM)도 좋은 평가
      1. * 구글 내부보고서에 따르면 “구글은 오픈AI와 경쟁하고 있는 것처럼 보이지만 오픈소스 AI 기술이 시장에서 앞서고 있다. 오픈소스 모델은 더 빠르고, 내부용으로 활용하기 더 좋으며, 훨씬 더 뛰어난 성능을 제공한다”라고 분석
    6. 생성AI 모델의 개발 진입 장벽 낮추겠다는 오픈소스 진영 행보에 탄력받아 오픈AI도 대형 언어 모델(LLM)을 오픈소스로 출시 준비중
      1. *최근 들어 인공지능(AI) 개발자들 사이의 구글이나 오픈AI 등 고가의 LLM보다는 오픈소스 커뮤니티에서 공유한 기술을 주로 활용하면서 오픈소스 모델 대중화 현상에 편승해 입지를 넓히려는 시도

 

□ 국내 최대 ‘공개SW 도전의 장’, 제17회 공개SW 개발자대회 참가자 모집

  • 과학기술정보통신부 주최 정보통신산업진흥원 주관의 ‘제17회 공개SW 개발자 대회’가 7월 20일까지 참가자 모집
    1. 올해로 17회째를 맞는 국내 최대의 규모의 ‘공개SW 도전의 장’인 이번 대회는 창의적인 공개SW 개발자 양성을 위해 최종 21개팀을 선발, 총상금 6,400만원을 지원하며 대상으로 과학기술정보통신부장관상 수여
    2. 공개SW에 관심 있는 국민이라면 누구나 참여할 수 있으며, 참가자는 프로젝트 기획, 개발, 구현, 협업 등의 개발 경험과 기능테스트, 라이선스 검증 등 공개SW의 전반적인 개발 과정을 경험
    3. 참가자들은 제공된 교육 자료를 학습하고, 자율적 개발을 거쳐 오는 9월 7일까지 출품작 제출
      1. * 1차 평가를 통해 1차 합격팀 선발, 결선 진출작에 대해서는 1개월간의 맞춤형 팀별 멘토링을 제공하여 개발역량 향상, 출품작의 고도화 기간을 갖게 되며 2차 평가를 거쳐 최종 수상작 선정
    4. 개발 주제는 인공지능(AI), 빅데이터, 클라우드, 사물인터넷, 블록체인 등 자유 과제와 공개SW 기업이 지정하는 과제(개방형OS, 클라우드 등), 환경/생활/안전/교육 등 사회문제 해결을 위한 과제, 이전 출품작의 성능향상을 위한 프로젝트 향상과제 등 4개 부문으로 구성
    5. ※ 자세한 내용은 공개SW 포털 내 개발자대회 페이지(https://www.oss.kr/dev_competition) 참조

 

□ 주목할 만한 월간 이슈(6월)

  • (SBOM) 과기정통부, SBOM 생성 법제화 추진
    1. 과학기술정보통신부가 소프트웨어 공급망 보안대책의 일환으로 SBOM(SW 명세서) 생성 법제화 추진
    2. 국내 SW기업들의 해외진출을 체계적으로 지원하기 위해 SBOM 생성 법제화 필요성을 제기
      1. * 정부가 SBOM 생성 법제화를 추진하는 이유는 솔라원즈, 로그4j 등 최근 몇년간 발생한 SW 공급망 공격 사례 때문이며 SW 공급망이 공격을 받게 되면 공급망을 통해 해당 SW 이용자들도 같은 공격을 받게 돼 피해가 상당히 커지기 때문임
    3. 올해 약 10억원의 예산을 투입하여 3개 기업에서 SBOM 실증사업을 진행, 기업의 부담을 줄이기 위한 자동화 솔루션 개발에 착수
      1. * SBOM 생성 플랫폼 구축 후 산업별 특성에 따른 DB(데이터베이스) 취약점 등을 수집하고 개발자들이 달라진 환경에서 느끼는 부담도 파악할 예정
    4. 정부는 SBOM으로 인한 기업 부담을 최소화하면서 법제화시킬 방안 모색중
  • (AI) 메타, AI 음악 생성기 ‘뮤진젠’ 오픈소스로 공개
    1. 메타가 원하는 음악 스타일을 자연어로 입력하면 음악을 생성해 주는 기술 ‘뮤직젠(MusicGen)’을 오픈소스로 공개
      1. * 뮤직젠 데모 페이지를 살펴보면 한쪽에는 음악 스타일을 적고 다른 한쪽에는 샘플 음악 파일을 업로드하면 이를 참고해 약 10초분량의 음악 생성
    2. 뮤직젠은 2만 시간 분량의 음악 데이터를 학습하였으며 코드는 MIT 라이선스 하에, 모델은 CC-BY-NC 라이선스 하에 공개
      1. * 학습 데이터에는 저작권 문제가 없는 고음질 음악 파일 1만 개와 악기 소리만 담은 음악 39만 개 파일이 포함되었으며 음악 저작권 소유 및 관리 기업인 셔터스톡(ShutterStock)과 폰드5(Pond5)와 협업
  • (반도체) 삼성전자, 첨단 반도체 생태계 구축 및 확산을 위한 'RISC-V' 오픈소스SW 개발 프로젝트 참여
    1. 리눅스재단이 발족한 오픈소스SW 개발 프로젝트 'RISE(RISC-V Software Ecosystem)'의 운영 이사회 멤버로 참여
      1. * RISE는 오픈소스 반도체 설계자산(IP, Intellectual Property)인 'RISC-V(리스크 파이브)'를 활용한 소프트웨어를 개발하기 위해 출범한 조직으로 삼성전자를 포함해 구글, 인텔, 엔비디아, 퀄컴 등 글로벌 IT·반도체 업체들이 참여
    2. 삼성전자 등 이번 RISE 프로젝트에 참여한 기업들은 RISC-V를 기반으로 한 소프트웨어를 공동 개발할 예정
      1. * RISC-V는 특정기업이 소유권을 갖지 않기 때문에 이를 활용한 소프트웨어가 개발되면 어떤 기업이든 무료로 반도체를 설계하는 데 활용할 수 있어 관련 생태계 확장에크게 기여할 것으로 예상
    3. 향후 모바일/가전/데이터센터/차량용 애플리케이션 등 다양한 분야에 활용될 것으로 기대
  • (모빌리티) 테슬라 전기차 운영체제 오픈소스화 제안
    1. 테슬라가 전기차 운영 시스템의 코드 일부를 다른 자동차 제조업체에 공개할 수 있다고 제안
    2. 테크크런치 등 외신에 따르면, 일론 머스크 CEO는 이날 트위터를 통해 짐 팔리 포드 CEO와 가진 대담을 통해 "안드로이드가 일종의 일반 표준으로 휴대폰 업계에 도움이 되는 것처럼, 잠재적으로 더 많은 코드를 오픈소스화할 수 있을 것"이라고 언급
    3. 테슬라 전기차OS를 오픈소스로 공개한다면, 안드로이드를 기반으로 자동차 운영체제를 개발한 구글은 물론 애플과도 경쟁 구도를 이룰 것으로 예상

 

□ 시사점

  • 이번 AI 코딩 도구의 오픈소스 라이선스 및 저작권 소송은 인공지능의 공정이용에 대한 명확한 기준이 마련되고 오픈 소스 개발자의 권리를 보호하는 데도 도움이 될 것으로 기대
  • 개발자 대회는 정부의 지속적인 정책적 지원으로 국내 오픈소스SW 시장을 한단계 성장시키고 오픈소스SW 개발자의 저변확대에 기여

 

※ 참고 Reference

 

 

Creative Commons LicenseOpen UP에 의해 작성된 이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다.
.
.
2023
공개SW 가이드/보고서 - 번호, 제목, 작성자, 조회수, 작성
번호 제목 작성자 조회수 작성
공지 [2024년] 오픈소스SW 라이선스 가이드 개정판 발간 file support 5011 2024-01-03
공지 [2024년] 기업 오픈소스SW 거버넌스 가이드 개정판 발간 file support 4082 2024-01-03
공지 [2024년] 공공 오픈소스SW 거버넌스 가이드 개정판 발간 file support 4079 2024-01-03
공지 공개 소프트웨어 연구개발(R&D) 실무 가이드라인 배포 file support 16507 2022-07-28
공지 공개소프트웨어 연구개발 수행 가이드라인 file OSS 16268 2018-04-26
461 2023 오픈소스 컨트리뷰션 아카데미, 협업과 열정으로 개발자의 성장 기회 제공 support 1028 2023-07-24
460 2023년 공개SW 개발자대회, 17회째 개최... 오픈소스를 기반으로 디지털 혁신 선도 support 1128 2023-07-24
459 [6월 월간브리핑]AI 코드제너레이터와 오픈소스 저작권 분쟁 : 라이선스 검증 필수 support 1548 2023-06-26
458 [기획기사] 생성형 AI 시대, 새로운 전략 도구 오픈소스 support 5127 2023-06-26
457 [기고] 생성형AI 개발도구 Copilot의 오픈소스 라이선스 위반과 저작권 분쟁 support 3405 2023-06-26
456 [기획기사] APM 시각화 기술에 유용한 오픈소스 JUI support 1395 2023-05-25
455 [기획] 오픈소스 APM 핀포인트 도입을 활용한 사례 소개 support 2514 2023-05-25
454 [5월 월간브리핑] 서비스 운영관리에 필수적인 성능관리 오픈소스 솔루션 support 1566 2023-05-25
453 [기획] 암호화폐와는 다른 오픈소스 NFT의 잠재력과 가능성 support 5380 2023-04-24
452 [기획기사] NFT 업계의 오픈소스 활용 support 1943 2023-04-24
맨 위로
맨 위로