2018 SAS,R, Python 선호도 조사...Burtch Works
2018년 9월 21일
데이터 과학과 머신 러닝 분야에서 선호하는 언어는 무엇입니까?
Burtch Works(미국의 데이터 과학 및 분석 전문가 채용 회사)는 지난 7월 데이터 과학자 및 분석 전문가 네트워크를 통해 SAS, R 또는 Python 중 선호하는 프로그래밍 언어를 조사한 결과를 발표하였습니다.
또한 인구 통계 정보에 대한 응답을 매칭하여 경력, 교육수준, 지역, 산업 분야별 선호도와 데이터 과학자 vs 기존 예측 분석 전문가의 선호도 차이 등도 확인할 수 있습니다.
[전반적인 결과] 2018년도는 Python 33%, R이 33%, SAS 34% 로 전반적으로 고르게 선호하는 양상을 보였습니다.
[최근 2년간 트렌드] 2016년부터 2년간의 추이를 보면 R은 선호도가 조금씩 떨어졌고, SAS는 비슷한 양상을 보이며, Python은 지속적으로 상승하였습니다.
[경력에 따른 선호도] R 및 Python과 같은 공개SW 도구는 5년 이하의 전문가가 압도적(R 38%, Python 48%)으로 선호합니다. 16년 이상의 전문가들은 SAS를 계속 선호(47%)하고 있으며, 6-15년의 경력의 전문가들은 R을 36%로 약간 더 선호하지만 SAS 33%, Python 31%로 언어간 차이는 5% 이내입니다.
[주니어 전문가의 선호도 변화] 5년 이하의 전문가에 대한 지난 3년간의 선호도 변화를 살펴보면 시장의 변화를 유추할 수 있습니다. 5년 이하 전문가들의 R과 SAS에 대한 선호도는 감소했습니다. R의 선호도는 2016년 50%가 넘었었지만 2018년도에는 40%에도 미치지 못합니다. 반면에 Python 선호도는 2016년 24%에서 2018년의 48%로 두 배로 R의 선호도를 역전하였습니다.
[교육수준에 따른 선호도] 학사 및 석사 학위 소지자는 SAS에 대한 선호도(39%, 37%)가 가장 높았으며, 박사 학위 소지자는 Python(43%), R(33%)과 같은 공개SW 도구를 선호했습니다. 이것은 연구 및 학술적 환경에서 공개SW 도구를 사용이 포함되며, 이러한 공개SW 도구의 선호도는 라이선스 비용이 없고 Python 모델을 제품 환경에 쉽게 적용 할 수 있다는 점 뿐만 아니라 여러 도구 중에 비즈니스 커리어에 함께 사용될 수 있는 점 등 여러 가지 이유 때문일 수 있습니다
[산업분야에 따른 선호도] SAS는 금융 서비스(42%) 및 의료/제약 업계(43%)에서 가장 높은 결과를 유지하고 있으며 Python은 기술/통신 회사(41%) 및 컨설팅 분야(40%)에서 높은 선호도를 보입니다. R은 소매 및 소비재 산업(39%)에서 우세하였습니다.
[데이터 과학자와 기존 예측 분석 전문가 비교] 데이터 과학자들은 Python(69%)을 압도적으로 선호하지만 구조화 된 데이터로 작업하는 예측 분석 전문가는 SAS(40%) 또는 R(34%)을 선호합니다.
[참고 : BurtWorks에서 정의한 ‘데이터 과학자’ 기준 ] Burtch Works에서는 급여 밴드, 도구 사용, 데이터 볼륨 및 구조 및 기타 다양한 요소의 차이로 인해 기존의 예측 분석 전문가와 데이터 과학자를 구분합니다. 가장 큰 차이점은 데이터 과학자는 주로 비구조화 또는 스트리밍 데이터로 작업하는 것으로 정의하는 반면, 기존의 예측 분석 전문가는 주로 구조화 된 데이터로 작업한다는 것입니다. |
* 전체 조사 결과를 시각적으로 보려면 이 설문조사결과 참조
※ 참고자료 Reference
- Not Just a Title: How to Identify a Data Scientist, 2015.05.11.
- 2017 SAS, R, or Python Flash Survey Results, 2017.06.19.
- 2018 SAS, R, or Python Survey Results: Which do Data Scientists & Analytics Pros Prefer?, 2018.07.16.
- 공개SW 역량프라자 -
번호 | 제목 | 작성자 | 조회수 | 작성 |
---|---|---|---|---|
공지 | [2024년] 오픈소스SW 라이선스 가이드 개정판 발간 file | support | 9355 | 2024-01-03 |
공지 | [2024년] 기업 오픈소스SW 거버넌스 가이드 개정판 발간 file | support | 7334 | 2024-01-03 |
공지 | [2024년] 공공 오픈소스SW 거버넌스 가이드 개정판 발간 file | support | 7257 | 2024-01-03 |
공지 | 공개 소프트웨어 연구개발(R&D) 실무 가이드라인 배포 file | support | 19878 | 2022-07-28 |
공지 | 공개소프트웨어 연구개발 수행 가이드라인 file | OSS | 18362 | 2018-04-26 |
326 | [Redhat Brandpost] 오픈시프트가 지원하는 베어메탈과 쿠버네티스 환경 | OSS | 2186 | 2018-11-02 |
325 | 오픈소스 보안 현황과 시사점 | OSS | 4454 | 2018-10-23 |
324 | 블로그 | 머신러닝, 이론과 실제의 간극 메우려면… | OSS | 1738 | 2018-10-10 |
323 | DevOps 성과을 위한 13가지 공개SW 툴 | OSS | 4762 | 2018-10-08 |
322 | [리눅스 재단] '엔터프라이즈를 위한 오픈 소스 가이드' 사이트 | OSS | 2163 | 2018-10-02 |
321 | 칼럼 | 성공적인 인공지능(AI) 적용을 위한 단계 | OSS | 2356 | 2018-10-01 |
320 | 2018 SAS,R, Python 선호도 조사...Burtch Works file | OSS | 2384 | 2018-09-21 |
319 | 칼럼 | 더 많은 개발자를 채용해야 한다, 그러나··· | OSS | 1945 | 2018-09-20 |
318 | [칼럼] GPL 라이선스의 이해 file | OSS | 40336 | 2018-09-19 |
317 | [공개SW 월간브리핑]대기업 업무의 중심이 되어가고 있는 공개SW 외 | OSS | 2881 | 2018-09-18 |
0개 댓글