본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

퀀텀블랙, 분석 프레임워크 '케드로' 오픈소스 전환

OSS관리자 게시글 작성 시각 2019-06-10 16:54:45 게시글 조회수 3826

6월 7일

ⓒ CIO Korea

 

퀀텀블랙(QuantumBlack)이 머신러닝 파이프라인을 간편하게 만들 수 있는 데이터 사이언티스트용 프레임워크를 오픈소스로 공개했다. 퀀텀블랙은 지난 2015년 매켄지(McKinsey)가 인수한 데이터 분석 전문 기업으로, 포뮬러 1 레이싱 팀 지원을 위해 개발한 성과물을 기반으로 창업했다.

 

퀀텀블랙은 '케드로(Kedro)'라 불리는 이 오픈소스 프레임워크가 머신러닝과 데이터 사이언스 부문에서 실무 단계 제품을 위한 업계 표준이 되기를 기대하고 있다.

 

퀀텀블랙의 엔지니어링과 제품 담당 글로벌 임원 미셸 베틀리는 컴퓨터월드 UK와의 인터뷰에서 "케드로는 데이터와 머신러닝 파이프라인을 만드는 데 쓸 수 있는 코드 라이브러리다. 그동안 우리가 내부적으로 애널리틱스나 머신러닝 프로젝트에서 사용하던 빌딩 블록이다. 케드로를 이용하면 데이터 사이언티스트와 엔지니어가 대규모 워크로드와 데이터 세트를 이용해 협업하는 방식을 개선할 수 있다. 협업의 결과물도 실무에서 바로 사용할 수 있다. 근본적으로 케드로는 여러 팀이 더 편리하게 협업할 수 있도록 지원한다. 협업하는 코드 내에서 다양한 룰과 구조를 사용하고 프로젝트 전반에 걸쳐 같은 상태를 유지하도록 하기 때문이다"라고 말했다.

 

케드로 프레임워크는 수년 전 엔지니어인 아리스 발타자노스와 니콜라스 체이우시스가 퀀텀블랙의 전 제품 매니저와 함께 인하우스 '팻 프로젝트(pet project)'로 개발됐다. 다양한 업무 스트림을 동시에 관리해야 하기 어려움을 해결하기 위해 만들었는데, 초기에는 파이썬 패키지 형태였다. 이후 이 툴은 사내 다른 팀으로 퍼져 나갔고 고객사와의 협업에서도 사용됐다. 그동안은 주로 내부 직원이 활용했지만, 앞으로는 오픈소스화를 통해 협업 과정 전체를 더 깊이 이해하고자 하는 고객사도 사용할 수 있게 됐다.

 

퀀텀블랙은 약 10년 전 포뮬러 1 경기장에서 창업했다. 업체의 설립자는 고객의 성과를 개선하기 위해 매우 다양한 데이터를 활용했는데, 이때 고객을 위한 솔루션으로 만든 것을 별도의 분석 툴로 확장한 것이 창업의 출발점이 됐다.

 

퀀텀블랙의 케드로 제품 담당 선임 컨설턴트 엣운드 다다는 "이 프레임워크를 오픈소스로 전환한 것은 더 많은 고객이 사용할 수 있도록 하기 위해서다. 우리와 협업했던 많은 고객이 이 소프트웨어를 사용하고 싶다고 요청했었다"라고 말했다. 케드로는 그동안 매켄지와 퀀텀블랙을 통해 50개 이상의 프로젝트에서 내부적으로 사용됐다. 다다와 베틀리에 따르면, 이 프레임워크는 여러 업계에서 쉽게 사용하고 간편하게 확장할 수 있도록 개발됐다. 따라서 상호운용성 관련 문제가 있을 때 (이론적으로는) 연결점을 만드는 작업도 어렵지 않다.

 

케드로에는 쉽게 사용할 수 있는 프로젝트 템플릿과 데이터 추상화 툴이 들어 있다. 여러 환경에서 코드를 재사용할 수 있는 코드 관리 기능, 설정 관리, 모듈화 기능도 지원해 큰 덩어리의 코드를 더 작은 컨테이너 유닛으로 나눌 수 있다. IT 전문가가 아니어도 쉽게 사용할 수 있고 테스트 주도 개발 문화를 만드는 데도 유용하다.

 

퀀텀블랙의 공동 설립자 사이먼 윌리엄은 올해 초 파이낸셜 타임스와의 인터뷰에서 "퀀텀블랙은 매켄지에 인수된 후에도 독립적으로 운영된다. 현재 전 세계 300명 정도의 직원이 있으며 몬트리올과 상파울루, 시카고, 보스턴, 시드니에 사무실이 있다"라고 말했다. 이번 오픈소스화에 대해 매켄지의 반대를 우려할 필요도 없다. 베틀리는 그는 "매켄지와 퀀텀블랙의 파트너십은 매우 독특한 가치를 제공한다. 고객이 변화 관리 기술과 퀀텀블랙의 애널리틱스 기술력 등이 매켄지가 보유한 전문성을 활용할 수 있기 때문이다. 케드로는 이런 파트너십의 기술적 기반이다"라고 말했다.

 

이제 다음 단계는 당연히 컨퍼런스 참여 등을 통해 이 프로젝트에 대해 널리 알리는 것이다. 다다는 "이런 작업 대부분은 어떻게 실제 라이브러리 사용을 늘릴 수 있느냐에 집중된다. 많은 사람이 이 라이브러리를 사용할 수 있도록 워크숍이나 웨비나를 여는 것 등도 고려하고 있다. 일단은 널리 알리고 이후 점차 코드에 대한 공헌도 늘어날 것으로 기대하고 있다. 케드로 라이브러리와 참고 문서는 깃허브에서 확인할 수 있다.

 

※ 본 내용은 CIO Korea (http://www.ciokorea.com)의 저작권 동의에 의해 공유되고 있습니다.

Copyright ⓒ CIO Korea무단전재 및 재배포 금지

[원문출처 : http://www.ciokorea.com/news/123920 ]

 

맨 위로
맨 위로