본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2024.01.26

ⓒ인공지능신문/ 박현진 기자

 

국내 연구진이 생성형 인공지능과 시각지능 기술을 결합해 문장 입력 시 2초 만에 이미지를 만드는 기술을 일반에 공개됐다.
한국전자통신연구원(ETRI)은 문장을 입력해 이미지를 만드는데 기존 대비 5배 빠른 ‘코알라(KOALA)’ 3종 모델과 이미지나 영상을 불러와 질의응답을 할 수 있는 대화형 시각언어모델 ‘코라바(Ko-LLaVA)’2종 등 총 5종 모델을 오픈소스로 공개했다.
먼저, ‘코알라(KOALA)’모델은 공개SW 모델의 2.56B(25억 개) 파라미터를 지식 증류 기법을 적용해 700M(7억 개)로 획기적으로 줄였다. 파라미터 수가 크면 연산량이 많아 시간이 오래 걸리고 서비스 운영 비용도 증가한다. 연구진은 모델 크기를 1/3로 축소했고, 고해상도 이미지를 기존 대비 2배, 달리(DALL-E) 3 대비 5배가량 빠르게 개선했다.
(후략)

 

[원본기사 : https://www.aitimes.kr/news/articleView.html?idxno=30153]

맨 위로
맨 위로