딥시크, LLM '추론 성능 향상법' 오픈 소스 공개..."코드 대신 자연어로 추론 훈련"
support
게시글 작성 시각 2025-02-17 17:44:31
2025.02.16
ⓒAI타임스 박찬 기자
딥시크가 대형언어모델(LLM)은 추론 성능을 향상하기 위한 새로운 사후 훈련 방식을 개발했다. 이 방식은 모델의 추론 과정이 실제로는 코드를 통해 진행된다는 데 착안, 자연어 설명을 추가해 LLM이 논리적 흐름을 자연스럽게 강화할 수 있도록 했다.
딥시크와 북경교통대학교, 홍콩과학기술대학교 연구진은 지난 11일 코드 기반 LLM 학습 과정을 자연어로 변환, 추론 능력을 강화하는 새로운 방식을 발표했다. 논문 제목은 ‘코드I/O(CODEI/O): 코드 입력-출력 예측을 통한 추론 패턴 응축’이다.
(후략)
[원본기사 출처 : https://www.aitimes.com/news/articleView.html?idxno=168039]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
11242 | [주간 OSS 동향리포트] AI 시대에 맞는 안전 인프라를 구축하는 루스트(ROOST) 공개 | 3568 | 2025-02-20 |
11241 | 자체 모델·오픈소스·MS 협력…KT, AI 3트랙 전략 가동 | 464 | 2025-02-17 |
11240 | 딥시크, LLM '추론 성능 향상법' 오픈 소스 공개..."코드 대신 자연어로 추론 훈련" | 628 | 2025-02-17 |
11239 | [AI는 지금] "오픈소스로 AI 주도권 잡는다"…中 딥시크·알리바바, 美에 도전장 | 417 | 2025-02-17 |
11238 | 딥시크 견제 나선다…바이두, 차세대 AI모델 오픈소스 개방 | 400 | 2025-02-17 |
11237 | [주간 OSS 동향리포트] 딥시크가 증명한 '오픈소스' 위력 | 3795 | 2025-02-13 |
11236 | 얀 르쿤 "EU, AI 모델 오픈소스 유지해야" | 493 | 2025-02-13 |
11235 | 오픈소스컨설팅, 대한상공회의소 VM서버 오픈소스 전환…비용 부담 해소 | 473 | 2025-02-13 |
11234 | AI 시대를 맞아 유력 기술 기업과 재단을 중심으로 무료 오픈 소스 도구 보급 지원에 나서 | 454 | 2025-02-13 |
11233 | 딥시크가 쏘아올린 오픈소스 논쟁…AI 경쟁 변수로 | 448 | 2025-02-13 |
0개 댓글