[주간 OSS 동향 리포트] 페이스북, 텍스트 없는 자연어처리를 가능케 하는 AI 모델 오픈소스로 공개
2021.09.14.
Open UP에서는 지난 한 주의 국내외 공개SW 관련 동향을 모아 정리합니다.
자세한 기사 내용은 아래 기사 내용 중 굵게 표시된 제목을 클릭하시면 보실 수 있습니다.
RoBERTA, GPT-3 등을 중심으로 한 텍스트 기반 인공지능 언어 모델의 발전과 함께, 자연어 처리(NLP) 애플리케이션의 사전 훈련 과정에서는 추론, 요약 및 분석 등 고난이도의 자연어 처리에 대용량 텍스트 데이터 세트가 필요하다는 난점이 생겨났습니다. 상기한 텍스트 의존 문제를 해결하기 위해, 페이스북은 자사 AI 연구팀을 통해 자동 음성 인식(ASR) 절차, 대용량 데이터 세트가 없이도 간단한 음원예측 과제 수행만을 필요로 하는 '생성적 화자 언어 모델(GSLM)'을 개발하고 이를 오픈 소스로 공개했습니다.
페이스북 AI 측의 설명에 의하면, GSLM은 음성을 개별단위로 변환한 후, 분리 단위 예측을 거쳐 다시 단위를 음성으로 변환하는 3단계 모델을 기반으로 음성을 분석합니다. 이 과정에서, 연구팀은 대규모 다국어 데이터셋의 사용을 통해 상기한 모델을 훈련하면서, 오디오의 언어 품질 및 다양성을 측정한 뒤 코덱을 사용해 음성을 압축 후 모델링하는 과정을 거쳤습니다.
GSLM은 원시 오디오 신호를 기반으로 작동하며. 텍스트 기반 언어 모델과는 다르게 데이터세트의 범위가 부족한 언어에서도 잘 작동하면서 보다 다양한 언어를 모델링할 수 있다는 장점이 있습니다. 또한, GSLM은 구술 언어의 풍부한 표현성과 어조, 억양을 살려 인간의 사고를 이해하는 데이터를 무한히 수집하면서도, ASR 절차에 대한 교육 없이도 방송, 오디오 앱 등과 같이 음성이 우선시되는 경험 관련 모델을 학습할 수 있습니다.
페이스북 측은 GSLM이 구어와 관련된 요약, 분석뿐만 아니라, 구술 언어에서의 라벨링된 데이터가 없는 상황에서도 인공지능 언어 모델의 사전 학습에 도움이 될 수 있다고 언급했습니다.
□ SK텔레콤, 오픈소스 컴플라이언스 분야 ISO 국제인증 획득 (아시아경제)
SK텔레콤은 9월 9일 리눅스재단이 주도하는 오픈소스 컴플라이언스 관련 유일한 국제표준인 '오픈체인 프로젝트'의 규격 기준을 충족하여, 국제표준화기구(ISO)로부터 상기한 표준 인증을 취득했다고 밝혔다. SK텔레콤은 표준 인증 과정에서 별도 위원회를 구성 후 사내 컴플라이언스 체계를 구축했으며, 사내 오픈소스 관련 교육, 오픈소스 포털 구축을 통한 연구 결과 공개 및 외부 개발자 지원 채널 구축 등의 오픈소스 친화적 행보를 통해 오픈체인 프로젝트가 요구하는 조건을 충족하며 향후 국제표준 준수 및 오픈소스 관련 노하우 공유를 약속하였다.
□ 마이크로소프트, 윈도11서 안드로이드앱 지원 임박...준비 착수 (디지털투데이)
마이크로소프트는 윈도11 운영체제에서 안드로이드 앱을 사용할 수 있도록 하는 프로그램인 안드로이드용 윈도 서브 시스템(WSA)의 출시를 준비하는 중으로, 미국의 IT 매체 ZDNet은 9월 2일 미완성 상태의 WSA가 마이크로소프트 스토어에 업로드되어 있다고 밝히며 향후 WSA가 독립된 앱이 아닌 시스템 서비스 및 업데이트 형태로 스토어에서 제공될 것으로 전망하였다. 또한, MS 측은 안드로이드, 윈도 양 시스템 간을 대리하는 네이티브 앱을 제공할 것이라고 밝히면서, 구글, 아마존 측에서 사용 중인 안드로이드 오픈소스 프로젝트(AOSP)와 호환되는 가상 머신을 지원한다고 밝혔다.
- Open UP -
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 359887 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 349720 | 2020-10-27 |
9587 | 오라클, 자바 17 공개 | 4520 | 2021-09-17 |
9586 | Arm, 자동차 SW 신기술 ‘SOAFEE’ 공개 | 4980 | 2021-09-17 |
9585 | ‘파스-타’, SW·서비스 생태계 지속 확대 | 3917 | 2021-09-16 |
9584 | 칼럼 | 하둡의 실패 넘어선다··· 오픈 데이터 분야를 견인하는 4가지 기술 동향 | 4395 | 2021-09-15 |
9583 | '안드로이드 탑재 강요' 구글에 과징금 2천억원… "경쟁 제한·혁신 저해" | 4341 | 2021-09-15 |
9582 | [주간 OSS 동향 리포트] 페이스북, 텍스트 없는 자연어처리를 가능케 하는 AI 모델 오픈소스로 공개 | 5076 | 2021-09-14 |
9581 | 오학주 고려대 교수팀, ‘SmarTest’ 기술 개발 | 4925 | 2021-09-14 |
9580 | 수세, 멀티 쿠버네티스 관리 플랫폼 ‘수세 랜처 2.6’ 출시 | 4362 | 2021-09-14 |
9579 | 통계청, '한국의 SDGs 데이터 플랫폼' 영문 서비스 개시 | 3745 | 2021-09-14 |
9578 | “파이썬, 선두 탈환에 바짝 다가섰다” 티오베 | 4361 | 2021-09-14 |
0개 댓글