본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2023.01.03

ⓒCIO Korea/이지현  |  CIO KR

 

캐나다 AI 스타트업 마이쉘(Myshell)이 MIT와 칭화대와 함께 목소리 생성을 위한 알고리즘 ‘오픈보이스(OpenVoice)’를 오픈소스 형태로 2일 공개했다.


오픈보이스는 짧은 오디오 클립을 기반으로 음성을 복제하는 제로샷 학습(zero-shot, 사전에 학습하지 않은 데이터에 대해서도 예측 및 처리하는 방식) 기반의 기술이다. 특히 오픈보이스는 예시로 입력된 목소리의 톤을 복제할 수 있으며, 감정, 억양, 리듬, 속도 등 음성 스타일을 세밀하게 조정해 생성한. 가령 영국 어린 아이가 활기차게 말하는 목소리 파일을 예시로 입력하면, 해당 목소리를 그대로 따라하는 원하는 음성을 생성할 수 있다. 성대모사를 하는 AI라고 생각하면 쉽다. 여기에 한국어를 포함한 다양한 국가의 언어로 목소리를 생성할 수 있다.
(후략)

 

[원본기사 : https://www.ciokorea.com/news/319617]

맨 위로
맨 위로