본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2022.05.09
ⓒ박찬 위원/AI타임스 

 

구글의 딥마인드(Deepmind)가 주어진 몇 장의 사진과 텍스트로 학습하고 사진을 설명하거나 질문에 응답할 수 있는 시각 언어 모델(Visual Language Model)을 공개했다. 이 새로운 모델은 다중 모드(Multi-modal) 작업을 위해 소량의 데이터로 학습하는 '퓨샷 학습(few-shot learning)'을 기반으로 이미지나 비디오 및 텍스트로 구성된 입력을 받아 주어진 입력과 관련된 텍스트를 출력한다.

(후략)

 

[원문 기사 :http://www.aitimes.com/news/articleView.html?idxno=144382]

 

 

맨 위로
맨 위로