본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

  • 2025.01.31
  • ⓒAI타임스 박찬기자

 

앨런 AI연구소(Ai2)가 강화 학습과 추론 강화를 포함한 사후 훈련(post-training)에 중점을 둔 새로운 오픈 소스 모델을 공개했다. 이 모델은 역대 최대 규모의 오픈 소스 대형언어모델(LLM) '딥시크-V3'를 능가한다고 강조했다.

Ai2는 30일(현지시간) 4050억 매개변수의 오픈 소스 LLM '튈루 3 405B(Tülu 3 405B)'를 출시했다고 발표했다. 이 모델은 데이터셋 구축부터 미세조정, 평가 프레임워크까지 AI 사후 훈련의 모든 단계를 포함하는 기술을 결합해 개발됐다.

(후략)

 

[원본기사 출처 : https://www.aitimes.com/news/articleView.html?idxno=167571]

 

 

맨 위로
맨 위로