애플, 최강 성능 오픈 소스 sLM ‘DCLM’ 출시..."데이터 큐레이션으로 성능 극대화"
support
게시글 작성 시각 2024-07-23 13:17:29
2024.07.21
ⓒAI타임스/박찬 기자
애플이 최강 성능의 새로운 오픈 소스 소형언어모델(sLM)을 출시했다. 데이터 큐레이션을 통한 고품질 데이터셋으로 모델을 훈련한 결과라고 주장했다.
벤처비트는 19일(현지시간) 애플이 2000토큰의 컨텍스트 창을 제공하는 70억(7B)과 14억(1.4B) 매개변수의 오픈 소스 sLM ‘DCLM(DataComp for Language Models)’’을 오픈 소스로 출시했다고 보도했다.
이에 따르면 DCLM은 ‘DCLM-베이스라인(DCLM-Baseline)’을 학습한 모델이다. 이 데이터셋은 머신러닝(ML) 모델로 대량의 데이터에서 고품질 데이터를 자동으로 필터링하고 선택하는 '데이터 큐레이션'을 통해 구축했다.
(후략)
[원본기사 : https://www.aitimes.com/news/articleView.html?idxno=161781]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 397783 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 387596 | 2020-10-27 |
11014 | 구글 자회사 직소, 테러 콘텐츠 식별하는 도구 ‘알티튜드’ 오픈소스로 공개 | 1604 | 2024-07-24 |
11013 | 애플, 최강 성능 오픈 소스 sLM ‘DCLM’ 출시..."데이터 큐레이션으로 성능 극대화" | 1168 | 2024-07-23 |
11012 | [주간 OSS 동향리포트] ‘2024 오픈소스 컨트리뷰션 아카데미(OSSCA) 참여형 발대식’을 개최 | 1813 | 2024-07-23 |
11011 | 엔비디아 “GPU 커널 모듈 모두 오픈소스로…” | 1080 | 2024-07-23 |
11010 | SW로 탄소중립을 실천하는 방법은?…오픈소스 역할 커져야 | 921 | 2024-07-23 |
11009 | "위험의 선행 지표를 살펴라" 오픈소스 소프트웨어의 10가지 위험과 완화 대책 | 1011 | 2024-07-19 |
11008 | "개발자에 특화된 번역 등…" 구글, 새로운 오픈소스 및 개발 툴 공개 | 1008 | 2024-07-19 |
11007 | 허깅페이스, 매개변수 135M에 불과한 ‘스몰LM’ 출시 | 908 | 2024-07-18 |
11006 | [주간 OSS 동향리포트] 정부, 2027년 시행 목표로 국가 SW공급망 보안 제도 마련 예정 | 1579 | 2024-07-18 |
11005 | NIPA "오픈소스 전문가 양성"···15개팀 발대식 | 867 | 2024-07-16 |
0개 댓글