애플, 최강 성능 오픈 소스 sLM ‘DCLM’ 출시..."데이터 큐레이션으로 성능 극대화"
support
게시글 작성 시각 2024-07-23 13:17:29
2024.07.21
ⓒAI타임스/박찬 기자
애플이 최강 성능의 새로운 오픈 소스 소형언어모델(sLM)을 출시했다. 데이터 큐레이션을 통한 고품질 데이터셋으로 모델을 훈련한 결과라고 주장했다.
벤처비트는 19일(현지시간) 애플이 2000토큰의 컨텍스트 창을 제공하는 70억(7B)과 14억(1.4B) 매개변수의 오픈 소스 sLM ‘DCLM(DataComp for Language Models)’’을 오픈 소스로 출시했다고 보도했다.
이에 따르면 DCLM은 ‘DCLM-베이스라인(DCLM-Baseline)’을 학습한 모델이다. 이 데이터셋은 머신러닝(ML) 모델로 대량의 데이터에서 고품질 데이터를 자동으로 필터링하고 선택하는 '데이터 큐레이션'을 통해 구축했다.
(후략)
[원본기사 : https://www.aitimes.com/news/articleView.html?idxno=161781]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 365568 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 355345 | 2020-10-27 |
11020 | 세일즈포스, 기존 10배 규모 오픈 소스 멀티모달 데이터셋 출시 | 1556 | 2024-07-29 |
11019 | 글로벌 AI 레이스 변화 바람 부나...中 기업들 오픈소스 AI 두각 | 1543 | 2024-07-29 |
11018 | [주간 OSS 동향리포트] 애플 오픈소스 sLM ‘DCLM’ 출시, 데이터 큐레이션으로 성능 극대화 | 2068 | 2024-07-29 |
11017 | 스위스, 정부 기관서 오픈소스 소프트웨어 사용 의무화 | 1498 | 2024-07-26 |
11016 | 메타, 오픈소스 LLM 라마3.1 시리즈 공개..."클라우드·보안 등 파트너 생태계 확대" | 1524 | 2024-07-24 |
11015 | 넷플릭스, 관리 시스템 '마에스트로' 오픈소스화 | 1611 | 2024-07-24 |
11014 | 구글 자회사 직소, 테러 콘텐츠 식별하는 도구 ‘알티튜드’ 오픈소스로 공개 | 1418 | 2024-07-24 |
11013 | 애플, 최강 성능 오픈 소스 sLM ‘DCLM’ 출시..."데이터 큐레이션으로 성능 극대화" | 954 | 2024-07-23 |
11012 | [주간 OSS 동향리포트] ‘2024 오픈소스 컨트리뷰션 아카데미(OSSCA) 참여형 발대식’을 개최 | 1596 | 2024-07-23 |
11011 | 엔비디아 “GPU 커널 모듈 모두 오픈소스로…” | 903 | 2024-07-23 |
0개 댓글