2018년 9월 21일

 

데이터 과학과 머신 러닝 분야에서 선호하는 언어는 무엇입니까?

 

[pixabay]

 

Burtch Works(미국의 데이터 과학 및 분석 전문가 채용 회사)는 지난 7월 데이터 과학자 및 분석 전문가 네트워크를 통해 SAS, R 또는 Python 중 선호하는 프로그래밍 언어를 조사한 결과를 발표하였습니다. 
또한 인구 통계 정보에 대한 응답을 매칭하여 경력, 교육수준, 지역, 산업 분야별 선호도와 데이터 과학자 vs 기존 예측 분석 전문가의 선호도 차이 등도 확인할 수 있습니다.

 

[전반적인 결과] 2018년도는 Python 33%, R이 33%, SAS 34% 로 전반적으로 고르게 선호하는 양상을 보였습니다.

 

[최근 2년간 트렌드] 2016년부터 2년간의 추이를 보면 R은 선호도가 조금씩 떨어졌고, SAS는 비슷한 양상을 보이며, Python은 지속적으로 상승하였습니다. 

 

[경력에 따른 선호도] R 및 Python과 같은 공개SW 도구는 5년 이하의 전문가가 압도적(R 38%, Python 48%)으로 선호합니다. 16년 이상의 전문가들은 SAS를 계속 선호(47%)하고 있으며, 6-15년의 경력의 전문가들은 R을 36%로 약간 더 선호하지만 SAS 33%, Python 31%로 언어간 차이는 5% 이내입니다. 

 

[주니어 전문가의 선호도 변화] 5년 이하의 전문가에 대한 지난 3년간의 선호도 변화를 살펴보면 시장의 변화를 유추할 수 있습니다. 5년 이하 전문가들의 R과 SAS에 대한 선호도는 감소했습니다. R의 선호도는 2016년 50%가 넘었었지만 2018년도에는 40%에도 미치지 못합니다. 반면에 Python 선호도는 2016년 24%에서 2018년의 48%로 두 배로 R의 선호도를 역전하였습니다.

 

[교육수준에 따른 선호도] 학사 및 석사 학위 소지자는 SAS에 대한 선호도(39%, 37%)가 가장 높았으며, 박사 학위 소지자는 Python(43%), R(33%)과 같은 공개SW 도구를 선호했습니다. 이것은 연구 및 학술적 환경에서 공개SW 도구를 사용이 포함되며, 이러한 공개SW 도구의 선호도는 라이선스 비용이 없고 Python 모델을 제품 환경에 쉽게 적용 할 수 있다는 점 뿐만 아니라 여러 도구 중에 비즈니스 커리어에 함께 사용될 수 있는 점 등 여러 가지 이유 때문일 수 있습니다 

 

[산업분야에 따른 선호도] SAS는 금융 서비스(42%) 및 의료/제약 업계(43%)에서 가장 높은 결과를 유지하고 있으며 Python은 기술/통신 회사(41%) 및 컨설팅 분야(40%)에서 높은 선호도를 보입니다. R은 소매 및 소비재 산업(39%)에서 우세하였습니다. 

 

[데이터 과학자와 기존 예측 분석 전문가 비교] 데이터 과학자들은 Python(69%)을 압도적으로 선호하지만 구조화 된 데이터로 작업하는 예측 분석 전문가는 SAS(40%) 또는 R(34%)을 선호합니다.

[참고 : BurtWorks에서 정의한 ‘데이터 과학자’ 기준 ]
Burtch Works에서는 급여 밴드, 도구 사용, 데이터 볼륨 및 구조 및 기타 다양한 요소의 차이로 인해 기존의 예측 분석 전문가와 데이터 과학자를 구분합니다. 가장 큰 차이점은 데이터 과학자는 주로 비구조화 또는 스트리밍 데이터로 작업하는 것으로 정의하는 반면, 기존의 예측 분석 전문가는 주로 구조화 된 데이터로 작업한다는 것입니다. 


* 전체 조사 결과를 시각적으로 보려면 이 설문조사결과 참조

 

※ 참고자료 Reference

  • Not Just a Title: How to Identify a Data Scientist, 2015.05.11.
  • 2017 SAS, R, or Python Flash Survey Results, 2017.06.19.
  • 2018 SAS, R, or Python Survey Results: Which do Data Scientists & Analytics Pros Prefer?, 2018.07.16.

 

- 공개SW 역량프라자 -

2018
번호 제목 작성자 조회수 작성
공지 [공개SW 월간브리핑]2018년 GitHub Octoverse를 통해 본 공개SW 프로그래밍 언어 순위 OSS 664 2018-12-04
공지 [공개SW 월간브리핑]대기업 업무의 중심이 되어가고 있는 공개SW 외 OSS 578 2018-09-18
공지 2018년 공개SW 기업 편람 및 솔루션맵 개정판 출간 OSS 948 2018-06-01
공지 공개소프트웨어 연구개발 수행 가이드라인 file OSS 1375 2018-04-26
공지 오픈소스 라이선스 해설 (Version 1.0.0)[개발자, 관리자, OS 전문가 및 기업 실무 지침] file OSS 8598 2017-07-05
공지 공공 공개SW 거버넌스 가이드 발간 file OSS 14611 2017-03-22
공지 U2L(Unix To Linux) FAQ 책자 발간 file OSS 14664 2017-03-15
324 칼럼 | 쏘리! 리눅스, 이제 주인공은 ‘쿠버네티스’다 OSS 98 2018-11-23
323 [Redhat Brandpost]컨테이너 플랫폼으로 데브옵스 환경까지 조성하는 법 OSS 96 2018-11-06
322 [Redhat Brandpost] ‘더 풍요로운 쿠버네티스 생태계의 미래’ 오픈시프트 4.0 이후를 말한다. OSS 106 2018-11-02
321 [Redhat Brandpost] 오픈시프트가 지원하는 베어메탈과 쿠버네티스 환경 OSS 113 2018-11-02
320 오픈소스 보안 현황과 시사점 OSS 237 2018-10-23
319 블로그 | 머신러닝, 이론과 실제의 간극 메우려면… OSS 211 2018-10-10
318 DevOps 성과을 위한 13가지 공개SW 툴 OSS 407 2018-10-08
317 [리눅스 재단] '엔터프라이즈를 위한 오픈 소스 가이드' 사이트 OSS 322 2018-10-02
316 칼럼 | 성공적인 인공지능(AI) 적용을 위한 단계 OSS 170 2018-10-01
315 2018 SAS,R, Python 선호도 조사...Burtch Works file OSS 368 2018-09-21
맨 위로
맨 위로