본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2025.01.20

ⓒCIO Korea 이지현 기자

 

AI 기업 딥시크가 자사의 첫 번째 추론 특화 AI 모델인 '딥시크-R1'과 '딥시크-R1-제로'를 20일 공개했다. 벤치마크 분석 자료에 따르면, 이번 R1 시리즈는 수학, 코딩, 복잡한 추론 능력에서 오픈AI의 모델과 거의 유사한 성능을 보이는 것으로 나타났다.

 

R1-제로는 지도학습 없이 강화학습만으로 개발된 모델로, 자체 검증, 성찰, 연쇄적 사고 등 뛰어난 추론 능력을 보여준다. 이 모델에서 발견된 무한 반복, 가독성 저하, 여러 언어 혼재 등의 문제점을 보완하기 위해 R1은 강화학습 전 기초 데이터를 선학습하는 방식으로 개발됐다. 6,710억 개 파라미터 규모의 R1은 128K 컨텍스트 길이를 지원한다.

MIT 라이선스로 허깅페이스를 통해 공개된 R1과 R1-제로는 학계 및 연구 단체의 활용을 위해 상업적 제한 없이 제공된다.

(후략)

 

[원본기사 : https://www.cio.com/article/3806228/%EA%B0%80%EA%B2%A9%EC%9D%80-%EC%98%A4%ED%94%88ai-%EB%8C%80%EB%B9%84-95-%EC%A0%80%EB%A0%B4-%EC%84%B1%EB%8A%A5%EC%9D%80-%EB%B9%84%EC%8A%B7-%C2%B7%C2%B7%C2%B7-ai-%EC%97%85%EA%B3%84.html]

맨 위로
맨 위로