딥시크, LLM '추론 성능 향상법' 오픈 소스 공개..."코드 대신 자연어로 추론 훈련"
support
게시글 작성 시각 2025-02-17 17:44:31
2025.02.16
ⓒAI타임스 박찬 기자
딥시크가 대형언어모델(LLM)은 추론 성능을 향상하기 위한 새로운 사후 훈련 방식을 개발했다. 이 방식은 모델의 추론 과정이 실제로는 코드를 통해 진행된다는 데 착안, 자연어 설명을 추가해 LLM이 논리적 흐름을 자연스럽게 강화할 수 있도록 했다.
딥시크와 북경교통대학교, 홍콩과학기술대학교 연구진은 지난 11일 코드 기반 LLM 학습 과정을 자연어로 변환, 추론 능력을 강화하는 새로운 방식을 발표했다. 논문 제목은 ‘코드I/O(CODEI/O): 코드 입력-출력 예측을 통한 추론 패턴 응축’이다.
(후략)
[원본기사 출처 : https://www.aitimes.com/news/articleView.html?idxno=168039]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
11246 | “정부, 투명하고 책임 있는 AI 개발 및 사용에 의무적인 오픈소스 채택 필요” | 4283 | 2025-02-25 |
11245 | 딥시크 "코드·데이터까지 완전 공개...오픈 소스 강화" | 4322 | 2025-02-25 |
11244 | "미중 패권 경쟁, 오픈소스 AI로 확산…생태계 강화해야" | 4379 | 2025-02-20 |
11243 | 딥시크 이어 그록2도 오픈소스 공개...폐쇄? 오픈? 고민 빠진 오픈AI | 1310 | 2025-02-20 |
11242 | [주간 OSS 동향리포트] AI 시대에 맞는 안전 인프라를 구축하는 루스트(ROOST) 공개 | 3658 | 2025-02-20 |
11241 | 자체 모델·오픈소스·MS 협력…KT, AI 3트랙 전략 가동 | 518 | 2025-02-17 |
11240 | 딥시크, LLM '추론 성능 향상법' 오픈 소스 공개..."코드 대신 자연어로 추론 훈련" | 670 | 2025-02-17 |
11239 | [AI는 지금] "오픈소스로 AI 주도권 잡는다"…中 딥시크·알리바바, 美에 도전장 | 463 | 2025-02-17 |
11238 | 딥시크 견제 나선다…바이두, 차세대 AI모델 오픈소스 개방 | 431 | 2025-02-17 |
11237 | [주간 OSS 동향리포트] 딥시크가 증명한 '오픈소스' 위력 | 3871 | 2025-02-13 |
0개 댓글