Ai2, '딥시크-V3' 능가하는 오픈 소스 405B LLM 공개..."사후 훈련에 중점"
support
게시글 작성 시각 2025-02-10 11:19:59
- 2025.01.31
- ⓒAI타임스 박찬기자
앨런 AI연구소(Ai2)가 강화 학습과 추론 강화를 포함한 사후 훈련(post-training)에 중점을 둔 새로운 오픈 소스 모델을 공개했다. 이 모델은 역대 최대 규모의 오픈 소스 대형언어모델(LLM) '딥시크-V3'를 능가한다고 강조했다.
Ai2는 30일(현지시간) 4050억 매개변수의 오픈 소스 LLM '튈루 3 405B(Tülu 3 405B)'를 출시했다고 발표했다. 이 모델은 데이터셋 구축부터 미세조정, 평가 프레임워크까지 AI 사후 훈련의 모든 단계를 포함하는 기술을 결합해 개발됐다.
(후략)
[원본기사 출처 : https://www.aitimes.com/news/articleView.html?idxno=167571]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
11219 | 미스트랄, 작고 효율적인 오픈 소스 sLM 출시..."기업용 온프레미스에 적합" | 554 | 2025-02-10 |
11218 | Ai2, '딥시크-V3' 능가하는 오픈 소스 405B LLM 공개..."사후 훈련에 중점" | 539 | 2025-02-10 |
11217 | "오픈소스 점유율 80% 달할것"…AI서비스 '폭발적 성장' 예고 | 558 | 2025-02-10 |
11216 | "딥시크 R1, 어떻게 만들었나?"…美연구진, AI역설계로 뜯어본다 | 1401 | 2025-01-31 |
11215 | 딥시크 쇼크?…저커버그 "오픈소스AI 확신..대규모 AI인프라 필요" | 1439 | 2025-01-31 |
11214 | 얀 르쿤 "中 딥시크 부상은 개방형 오픈 소스의 힘" | 1356 | 2025-01-31 |
11213 | [주간 OSS 동향리포트] 금융결제원, 오픈소스 국제 표준 인증 획득 | 4330 | 2025-01-27 |
11212 | 「금융권 생성형 AI 활용지원방안」의 주요 내용과 시사점 | 1867 | 2025-01-24 |
11211 | [주간 OSS 동향리포트] 오픈소스 분야에서 주목할 트랜드 4가지 | 4959 | 2025-01-22 |
11210 | “가격은 오픈AI 대비 95% 저렴, 성능은 비슷” ··· AI 업계 슈퍼 루키 딥시크, 추론 모델 ‘R1’ 오픈소스로 공개 | 2162 | 2025-01-22 |
0개 댓글