“원하는 감정·억양 넣은 목소리 만든다”··· 마이쉘, 목소리 생성 오픈소스 알고리즘 공개
support
게시글 작성 시각 2024-01-04 10:21:09
2023.01.03
ⓒCIO Korea/이지현 | CIO KR
캐나다 AI 스타트업 마이쉘(Myshell)이 MIT와 칭화대와 함께 목소리 생성을 위한 알고리즘 ‘오픈보이스(OpenVoice)’를 오픈소스 형태로 2일 공개했다.
오픈보이스는 짧은 오디오 클립을 기반으로 음성을 복제하는 제로샷 학습(zero-shot, 사전에 학습하지 않은 데이터에 대해서도 예측 및 처리하는 방식) 기반의 기술이다. 특히 오픈보이스는 예시로 입력된 목소리의 톤을 복제할 수 있으며, 감정, 억양, 리듬, 속도 등 음성 스타일을 세밀하게 조정해 생성한. 가령 영국 어린 아이가 활기차게 말하는 목소리 파일을 예시로 입력하면, 해당 목소리를 그대로 따라하는 원하는 음성을 생성할 수 있다. 성대모사를 하는 AI라고 생각하면 쉽다. 여기에 한국어를 포함한 다양한 국가의 언어로 목소리를 생성할 수 있다.
(후략)
[원본기사 : https://www.ciokorea.com/news/319617]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 515407 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 505247 | 2020-10-27 |
10839 | “올해 레거시 데이터베이스서 오프소스로 이동 가속화” | 1321 | 2024-01-18 |
10838 | 삼성 타이젠 OS, AI 집사 ‘볼리’에도 탑재 | 1387 | 2024-01-15 |
10837 | 리눅스 커널 6.7 업데이트…역대급 규모 기능 추가 | 1646 | 2024-01-11 |
10836 | [주간 OSS 동향리포트] 기계 전문용어 번역 분야 오픈소스 솔루션 ‘패스터 위스퍼’ 공개 | 2274 | 2024-01-09 |
10835 | 누구나 온디바이스에서 생성 AI 구현하는 시대로...메타 ·구글·미스트랄에 이어 MS, sLLM '파이 2' 완전 오픈 소스화! | 1966 | 2024-01-08 |
10834 | “원하는 감정·억양 넣은 목소리 만든다”··· 마이쉘, 목소리 생성 오픈소스 알고리즘 공개 | 1906 | 2024-01-04 |
10833 | 칼럼 | 2024년 오픈소스, 클라우드와 AI에 발맞춰야 한다 | 1785 | 2024-01-03 |
10832 | 시스트란, 전문용어 기계번역 오픈소스 솔루션 ‘패스터 위스퍼’ 공개 | 1826 | 2024-01-03 |
10831 | [AI 이슈] 서울대 김현우 박사팀, AI 학회 EMNLP서 국내 최초 우수논문상 수상 및 세계 최대 규모 일상 대화 데이터셋 ‘SODA’ 오픈소스로 공개 | 1686 | 2024-01-03 |
10830 | [주간 OSS 동향리포트] 애플, 오픈소스 대형멀티모달모델(LMM) '페렛(Ferret)'출시 | 2330 | 2024-01-02 |
0개 댓글