2022.05.09
ⓒ박찬 위원/AI타임스
구글의 딥마인드(Deepmind)가 주어진 몇 장의 사진과 텍스트로 학습하고 사진을 설명하거나 질문에 응답할 수 있는 시각 언어 모델(Visual Language Model)을 공개했다. 이 새로운 모델은 다중 모드(Multi-modal) 작업을 위해 소량의 데이터로 학습하는 '퓨샷 학습(few-shot learning)'을 기반으로 이미지나 비디오 및 텍스트로 구성된 입력을 받아 주어진 입력과 관련된 텍스트를 출력한다.
(후략)
[원문 기사 :http://www.aitimes.com/news/articleView.html?idxno=144382]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 297125 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 287450 | 2020-10-27 |
9986 | [주간 OSS 동향 리포트]"디지털플랫폼정부, 오픈소스로 구축해 예산 절감하고 효용 높여야" | 3398 | 2022-05-10 |
9985 | 클리어패스 로보틱스, 오픈소스 로봇플랫폼 '터틀봇4' 출시 | 3899 | 2022-05-09 |
9984 | 아크데이타, 카프카 플랫폼 지원하는 '아크 포 카프카' 출시 | 3226 | 2022-05-09 |
9983 | [ET단상]시스템반도체 시장경쟁력은 오픈소스 SW에 있다 | 3303 | 2022-05-09 |
9982 | "무엇이든 물어봐"...딥마인드, 소량의 데이터 만으로 학습하는 시각 언어 모델 공개 | 3188 | 2022-05-09 |
9981 | 메타, 언어 모델 OPT-175B 무료 공개 | 3735 | 2022-05-09 |
9980 | 깃허브, 2023년 말까지 모든 사용자 대상으로 ‘2FA’ 의무화한다 | 3464 | 2022-05-06 |
9979 | 파이썬 언어를 사랑하는 글로벌 대기업 TOP10 | 4616 | 2022-05-06 |
9978 | [코딩 트렌드] 자바, 5월 PyPL 인기 프로그래밍 언어 랭킹 2위...티오베 지수 3위 | 3171 | 2022-05-06 |
9977 | 오므론, 다중 자율 이동 로봇에서 인공지능 기반 '각 로봇 경로계획플랫폼(CTRM)’ 오픈소스로 공개 | 3725 | 2022-05-06 |
0개 댓글