본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2024.01.02

인공지능신문 / 최광민 기자

 

기존 대화형 인공지능(Conversational AI) 분야는 고질적으로 데이터 부족 문제에 시달려왔다. 일상에서 이뤄지는 대화들은 데이터로 기록되지 않는 경우가 대부분이기 때문이다. 문자 메세지나 이메일 같은 형태로 대화가 기록되더라도 여러 법적 제약들이 존재하기 때문에 이를 연구에 활용하기에는 어려웠다.

이에 대안으로 그동안 크라우드 소싱을 통해 대화 데이터셋을 제작해왔지만 비용도 많이 들고, 만들 수 있는 데이터셋 크기도 작은 문제점이 있다. 그 결과, 기존 대화 관련 연구들은 모두 소수의 작은 데이터셋 위에서 이루어져 범용성에 큰 제약이 있었다.

서울대학교 공과대학(학장 홍유석)은 컴퓨터공학부 김현우 박사와 김건희 교수가 미국 시애틀 앨런 인공지능 연구소(Allen Institute for AI; AI2) 및 워싱턴대학교(University of Washington)의 최예진 교수 등과 함께 진행한 연구가 국제 최우수 자연어처리 학술대회 'EMNLP 2023'에서 최우수논문상(Outstanding Paper Award)를 수상하고 세계 최초로 150만 규모의 세계 최대 고품질 일상 대화 데이터셋 '소다(SODA)'를 오픈소스로 공개했다.
(후략)

 

[원본기사 : https://www.aitimes.kr/news/articleView.html?idxno=29894]

공개SW 소식 - 번호, 제목, 조회수, 작성
번호 제목 조회수 작성
공지 [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" 299262 2020-10-27
공지 [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 289134 2020-10-27
10837 리눅스 커널 6.7 업데이트…역대급 규모 기능 추가 1000 2024-01-11
10836 [주간 OSS 동향리포트] 기계 전문용어 번역 분야 오픈소스 솔루션 ‘패스터 위스퍼’ 공개 1543 2024-01-09
10835 누구나 온디바이스에서 생성 AI 구현하는 시대로...메타 ·구글·미스트랄에 이어 MS, sLLM '파이 2' 완전 오픈 소스화! 1238 2024-01-08
10834 “원하는 감정·억양 넣은 목소리 만든다”··· 마이쉘, 목소리 생성 오픈소스 알고리즘 공개 1222 2024-01-04
10833 칼럼 | 2024년 오픈소스, 클라우드와 AI에 발맞춰야 한다 1131 2024-01-03
10832 시스트란, 전문용어 기계번역 오픈소스 솔루션 ‘패스터 위스퍼’ 공개 1055 2024-01-03
10831 [AI 이슈] 서울대 김현우 박사팀, AI 학회 EMNLP서 국내 최초 우수논문상 수상 및 세계 최대 규모 일상 대화 데이터셋 ‘SODA’ 오픈소스로 공개 958 2024-01-03
10830 [주간 OSS 동향리포트] 애플, 오픈소스 대형멀티모달모델(LMM) '페렛(Ferret)'출시 1550 2024-01-02
10829 아파치 오픈소스 ERP 시스템, 인증 우회 취약점 발견 855 2024-01-02
10828 얀 르쿤 "AI 발전 위해선 오픈소스 생태계 키워야" 671 2023-12-28
맨 위로
맨 위로