딥시크, LLM '추론 성능 향상법' 오픈 소스 공개..."코드 대신 자연어로 추론 훈련"
support
게시글 작성 시각 2025-02-17 17:44:31
2025.02.16
ⓒAI타임스 박찬 기자
딥시크가 대형언어모델(LLM)은 추론 성능을 향상하기 위한 새로운 사후 훈련 방식을 개발했다. 이 방식은 모델의 추론 과정이 실제로는 코드를 통해 진행된다는 데 착안, 자연어 설명을 추가해 LLM이 논리적 흐름을 자연스럽게 강화할 수 있도록 했다.
딥시크와 북경교통대학교, 홍콩과학기술대학교 연구진은 지난 11일 코드 기반 LLM 학습 과정을 자연어로 변환, 추론 능력을 강화하는 새로운 방식을 발표했다. 논문 제목은 ‘코드I/O(CODEI/O): 코드 입력-출력 예측을 통한 추론 패턴 응축’이다.
(후략)
[원본기사 출처 : https://www.aitimes.com/news/articleView.html?idxno=168039]
| 번호 | 제목 | 조회수 | 작성 |
|---|---|---|---|
| 11244 | "미중 패권 경쟁, 오픈소스 AI로 확산…생태계 강화해야" | 5547 | 2025-02-20 |
| 11243 | 딥시크 이어 그록2도 오픈소스 공개...폐쇄? 오픈? 고민 빠진 오픈AI | 2772 | 2025-02-20 |
| 11242 | [주간 OSS 동향리포트] AI 시대에 맞는 안전 인프라를 구축하는 루스트(ROOST) 공개 | 7784 | 2025-02-20 |
| 11241 | 자체 모델·오픈소스·MS 협력…KT, AI 3트랙 전략 가동 | 2152 | 2025-02-17 |
| 11240 | 딥시크, LLM '추론 성능 향상법' 오픈 소스 공개..."코드 대신 자연어로 추론 훈련" | 2003 | 2025-02-17 |
| 11239 | [AI는 지금] "오픈소스로 AI 주도권 잡는다"…中 딥시크·알리바바, 美에 도전장 | 1649 | 2025-02-17 |
| 11238 | 딥시크 견제 나선다…바이두, 차세대 AI모델 오픈소스 개방 | 1646 | 2025-02-17 |
| 11237 | [주간 OSS 동향리포트] 딥시크가 증명한 '오픈소스' 위력 | 7982 | 2025-02-13 |
| 11236 | 얀 르쿤 "EU, AI 모델 오픈소스 유지해야" | 1755 | 2025-02-13 |
| 11235 | 오픈소스컨설팅, 대한상공회의소 VM서버 오픈소스 전환…비용 부담 해소 | 1682 | 2025-02-13 |



0개 댓글