“원하는 감정·억양 넣은 목소리 만든다”··· 마이쉘, 목소리 생성 오픈소스 알고리즘 공개
support
게시글 작성 시각 2024-01-04 10:21:09
2023.01.03
ⓒCIO Korea/이지현 | CIO KR
캐나다 AI 스타트업 마이쉘(Myshell)이 MIT와 칭화대와 함께 목소리 생성을 위한 알고리즘 ‘오픈보이스(OpenVoice)’를 오픈소스 형태로 2일 공개했다.
오픈보이스는 짧은 오디오 클립을 기반으로 음성을 복제하는 제로샷 학습(zero-shot, 사전에 학습하지 않은 데이터에 대해서도 예측 및 처리하는 방식) 기반의 기술이다. 특히 오픈보이스는 예시로 입력된 목소리의 톤을 복제할 수 있으며, 감정, 억양, 리듬, 속도 등 음성 스타일을 세밀하게 조정해 생성한. 가령 영국 어린 아이가 활기차게 말하는 목소리 파일을 예시로 입력하면, 해당 목소리를 그대로 따라하는 원하는 음성을 생성할 수 있다. 성대모사를 하는 AI라고 생각하면 쉽다. 여기에 한국어를 포함한 다양한 국가의 언어로 목소리를 생성할 수 있다.
(후략)
[원본기사 : https://www.ciokorea.com/news/319617]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 316680 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 306380 | 2020-10-27 |
10836 | [주간 OSS 동향리포트] 기계 전문용어 번역 분야 오픈소스 솔루션 ‘패스터 위스퍼’ 공개 | 1792 | 2024-01-09 |
10835 | 누구나 온디바이스에서 생성 AI 구현하는 시대로...메타 ·구글·미스트랄에 이어 MS, sLLM '파이 2' 완전 오픈 소스화! | 1497 | 2024-01-08 |
10834 | “원하는 감정·억양 넣은 목소리 만든다”··· 마이쉘, 목소리 생성 오픈소스 알고리즘 공개 | 1473 | 2024-01-04 |
10833 | 칼럼 | 2024년 오픈소스, 클라우드와 AI에 발맞춰야 한다 | 1344 | 2024-01-03 |
10832 | 시스트란, 전문용어 기계번역 오픈소스 솔루션 ‘패스터 위스퍼’ 공개 | 1294 | 2024-01-03 |
10831 | [AI 이슈] 서울대 김현우 박사팀, AI 학회 EMNLP서 국내 최초 우수논문상 수상 및 세계 최대 규모 일상 대화 데이터셋 ‘SODA’ 오픈소스로 공개 | 1238 | 2024-01-03 |
10830 | [주간 OSS 동향리포트] 애플, 오픈소스 대형멀티모달모델(LMM) '페렛(Ferret)'출시 | 1835 | 2024-01-02 |
10829 | 아파치 오픈소스 ERP 시스템, 인증 우회 취약점 발견 | 1123 | 2024-01-02 |
10828 | 얀 르쿤 "AI 발전 위해선 오픈소스 생태계 키워야" | 884 | 2023-12-28 |
10827 | 애플, 오픈 소스 LMM 출시 뒤늦게 알려져..."크리스마스 선물 같은 소식" | 991 | 2023-12-26 |
0개 댓글