본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2024.01.02

인공지능신문 / 최광민 기자

 

기존 대화형 인공지능(Conversational AI) 분야는 고질적으로 데이터 부족 문제에 시달려왔다. 일상에서 이뤄지는 대화들은 데이터로 기록되지 않는 경우가 대부분이기 때문이다. 문자 메세지나 이메일 같은 형태로 대화가 기록되더라도 여러 법적 제약들이 존재하기 때문에 이를 연구에 활용하기에는 어려웠다.

이에 대안으로 그동안 크라우드 소싱을 통해 대화 데이터셋을 제작해왔지만 비용도 많이 들고, 만들 수 있는 데이터셋 크기도 작은 문제점이 있다. 그 결과, 기존 대화 관련 연구들은 모두 소수의 작은 데이터셋 위에서 이루어져 범용성에 큰 제약이 있었다.

서울대학교 공과대학(학장 홍유석)은 컴퓨터공학부 김현우 박사와 김건희 교수가 미국 시애틀 앨런 인공지능 연구소(Allen Institute for AI; AI2) 및 워싱턴대학교(University of Washington)의 최예진 교수 등과 함께 진행한 연구가 국제 최우수 자연어처리 학술대회 'EMNLP 2023'에서 최우수논문상(Outstanding Paper Award)를 수상하고 세계 최초로 150만 규모의 세계 최대 고품질 일상 대화 데이터셋 '소다(SODA)'를 오픈소스로 공개했다.
(후략)

 

[원본기사 : https://www.aitimes.kr/news/articleView.html?idxno=29894]

맨 위로
맨 위로