본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

[해외] R 커뮤니티의 성장, 상용 업체들을 위협한다.

OSS 게시글 작성 시각 2016-04-29 19:49:14 게시글 조회수 3287

2016년 04월 21일 (목)


오픈소스 R은 2백만 명이라는 두터운 사용층, 프로그래밍 언어로서의 R, 그리고 그들의 오픈소스 커뮤니티로 상징된다. 유사한 기능의 제품을 가진 상용 업체들은 어떻게 이런 R과 맞설 수 있을 것인가?


R 패키지들을 모은 배포 사이트인 크란(CRAN;www.r-project.org) 는 급격하게 성장하고 있다. Cricsheet에서 Cricket 활동을 분석하고 싶다면 적합한 크란 패키지가 있다. 혹은 타임 시리즈 예측에 사용하기 더 쉬운 기능을 원한다면 이에 유용한 크란 패키지도 있다. 지금 이 순간에도 R을 위한 8,270개의 이용 가능한 패키지가 존재한다. 이 수치로 2006년 고작 몇 백 개에 불가했지만 지금은 엄청나게 증가했음을 알 수 있다.

과연 유사 솔루션을 가진 상용 업체가 파워풀한 R의 성장속도를 따라갈 수 있을지 의문이다.

커뮤니티의 급격한 성장

사실 이점은 의문스러운 수준을 넘어 불가능에 가깝다. R 관련 서적 유명 저자인 밥 뮌헨은, “2014년까지만 보더라도 R는 SAS사가 창립 이래로 써 온 기능보다도 더 많은 기능을 추가했다.”고 밝혔다. R을 대체할만한 유력한 통계적 컴퓨팅 소프트웨어 환경을 구현하는 상용 업체는 SAS사가 있다.


SAS사는 2015년에 30억불의 매출을 올렸다고 발표했다. 회사가 R 주변에서 돈을 벌었지만 기능적인 성장을 이끈 주요 요인은 이익으로 충족되지 않는다. 커뮤니티가 더 파워풀하기 때문이다. ‘R이 현재 SAS보다 150배 많은 커맨드를 보유하게 만든’ 혁신을 촉진시킨 것이 바로 커뮤니티다. 뮌헨은 작년에 이같이 밝혔고 현재 R 커뮤니티 소유의 커맨드 숫자는 더 많아졌다.


또한 그는 물론 SAS와 R 간에 커맨드 비교는 불완전하다고 말한다.


SAS와 R 커맨드로 같은 문제를 해결할 수 있다. 하지만 둘은 절대 같지 않다. SAS의 몇몇 과정은 산출물을 컨트롤 할 수 있는 옵션이 R 보다 많다. 그 말은 하나의 SAS 과정은 많은 R 기능과 같다는 말이다. 그러나 R의 기능은 서로 조합될 수 있으며 무한에 가까운 조합이 가능하다. 비교가 완벽하지 않지만 이로써 R의 성장률과 규모에 대한 재미있는 관점을 엿볼 수 있다.


R 전문가 앙드리 드 브리스(Andrie De Vries)가 CRAN 패키지 수를 통해 얼마나 빨리 새로운 기능이 R에 추가되었는가 하는 성장성을 아래 그림과 같이 나타냈다.



차트는 “기여도가 부단한지, 가속적인지, 아니면 감속적인지” 표시하지 않지만, R의 유틸리티가 드라마틱한 성장을 보이는 것을 확인할 수는 있다. 아이러니하게도 현재 R을 사용하면서 부딪히는 가장 힘든 일은 그 많은 패키지 중에서 특정 과업에 최적화된 패키지를 찾는 것이다.


R 전문가 존 폭스는 사실 의도되지 않은 기발한 변화의 하나로 R의 핵심 개발팀이 패키지 시스템을 통해 개발한 R을 공개한 것을 들 수 있다고 설명한다. 그는 “버전 컨트롤과 같은 패키지 시스템은 그 많은 참여자들이 핵심 개발팀의 리소스에 압도되지 않으면서 어떻게 초대하고, 동기부여하고, 조직적 활동을 관리할지”와 같은 관계적인 문제에 대해 기술적인 해결책이 되었다는 의미로 볼 수 있다.


2015년 O’Reilly 조사 결과에 따르면 데이터 분석을 위한 프로그래밍 언어 중 R은 현재 Python과 함께 인기리에 사용되고 있다. 한 Python 전문가는 “Python은 현재 약 8만개의 패키지를 가지고 있다”고 밝혔다.


더불어 그는 “좋은 커뮤니티는 수용할 줄 안다”고 강조한다.

작년에 R 재단이 해온 비상업적 커뮤니티 활동들 보다 더 많은 기업들이 R과 콜라보 할 수 있는 기회를 제공하기 위해 R 컨소시엄이 설립되었다. 그 시기에 리눅스 재단 전무이사인 짐 젬린은 R이 가진 개발을 장려하는 정신에 대해 언급했다: “몇 백만의 데이터 학자들과 연구원들은 항상 R을 사용하고 있고 그들은 동기들이나 같은 관심을 둔 멤버들과 함께 협력하여 시각화 및 분석 기술에 대해 공유하고 싶어 한다.”


오픈소스는 항상 규율과 코드 쉐어에 대한 관심과 재능을 가지고 있는 많은 인재들로 덕분에 운영된다. 즉 R커뮤니티는 R 패키지의 구축 능력과 자신들의 성과를 공유한다는 원칙을 가진 기술 커뮤니티라고 말할 수 있다. R 커뮤니티의 점유율로 인해 오랜기간 그에 경쟁할 수 있는 상용 기업이 과연 하나라도 존재할 수 있을지 의문이다.


* 기사출처 : (http://www.techrepublic.com/article/exponential-growth-of-rs-open-source-community-threatens-commercial-competitors/)



- 공개SW역량프라자

맨 위로
맨 위로