2017년 6월 23일 (금)
ⓒ ITWorld, Serdar Yegulalp| InfoWorld
텐서투텐서(Tensor2Tensor, T2T)는 딥러닝 모델 훈련을 간소화해 개발자가 머신러닝 워크플로우를 좀더 쉽게 만들 수 있게 한다.
지난 한해 동안 구글의 텐서플로우(TensorFlow)는 딥 러닝을 위해 널리 사용되는 오픈소스 툴킷으로 자리잡아왔다. 그러나 텐서플로우 모델을 교육하는 것은 번거롭고 느린 것이 단점이었다. 특히 누군가가 사용한 데이터세트를 가져와 교육 프로세스를 개선하려 할 때 그러하다. 모델 교육 프로세스의 변형만으로도 딥러닝 전문가들을 난감하게 만들기에 충분하다.
이번주 구글은 교육을 위한 딥 러닝 모델 구성 작업량을 줄이기 위한 프로젝트를 공개했다. 간단히 말하면, T2T는 텐서플로우 교육 작업을 위한 파이썬(Python) 기반 워크플로우 조직 라이브러리다. 이를 통해 개발자는 텐서플로우 모델에 사용된 핵심 요소를 지정하고 이들 간의 관계를 정의할 수 있다.
T2T의 핵심 요소는 다음과 같다.
- 데이터 세트 : T2T에는 교육을 위한 여러가지 일반 데이터세트가 내장되어 있다. 사용자는 개별 워크플로우에 새로운 데이터세트를 추가하거나 끌어오기를 요청해 핵심 T2T 프로젝트에 추가할 수 있다.
- 문제와 양식 : 음성인식과 같은 것이 어떤 종류의 작업인지를, 그것으로 생성되는 데이터 종류가 어떤 것인지 설명한다. 예를 들어, 이미지 인식 시스템은 이미지들을 가져와 텍스트 레이블로 돌려준다.
- 모델 : 일반적으로 많이 사용되는 모델은 이미 T2T에 등록되어 있지만, 사용자는 더 추가할 수 있다.
- 하이퍼파라미터(hyperparameter) : 교육 프로세스를 제어하는 다양한 설정 세트를 만들 수 있다. 그래서 사용자는 필요할 때마다 그것들을 교환하거나 배치할 수 있다.
- 강사 : 실제 교육 바이너리에 전달된 파라미터를 개별적으로 지정할 수 있다.
T2T는 각 요소에 대해 기본값이 제공되기 때문에 즉각적으로 유용하게 쓰일 수 있다. T2T에는 수개의 일반적인 모델과 데이터세트가 담겨져 있어 기존 모드를 재사용하거나 확장해 신속하게 시작할 수 있으며, 필요에 따라 기본값과 수정값 가운데 하나를 배포할 수 있다.
다만 T2T는 딥 러닝 프로젝트를 구성하는 방법에 대해 텐서플로우 이외에 더 큰 콘텍스트는 제공하지 않는다. 이론적으로는 머신러닝 솔루션을 개발하기 위한 데이터에서 예측 시스템까지, 엔드투엔드의 일부가 될 수 있지만 지금은 텐서플로우를 사용하는 작업을 간단하게 만드는 것에 절대적인 가치를 두고 있다.
지난 한해 동안 구글의 텐서플로우(TensorFlow)는 딥 러닝을 위해 널리 사용되는 오픈소스 툴킷으로 자리잡아왔다. 그러나 텐서플로우 모델을 교육하는 것은 번거롭고 느린 것이 단점이었다. 특히 누군가가 사용한 데이터세트를 가져와 교육 프로세스를 개선하려 할 때 그러하다. 모델 교육 프로세스의 변형만으로도 딥러닝 전문가들을 난감하게 만들기에 충분하다.
이번주 구글은 교육을 위한 딥 러닝 모델 구성 작업량을 줄이기 위한 프로젝트를 공개했다. 간단히 말하면, T2T는 텐서플로우 교육 작업을 위한 파이썬(Python) 기반 워크플로우 조직 라이브러리다. 이를 통해 개발자는 텐서플로우 모델에 사용된 핵심 요소를 지정하고 이들 간의 관계를 정의할 수 있다.
T2T의 핵심 요소는 다음과 같다.
- 데이터 세트 : T2T에는 교육을 위한 여러가지 일반 데이터세트가 내장되어 있다. 사용자는 개별 워크플로우에 새로운 데이터세트를 추가하거나 끌어오기를 요청해 핵심 T2T 프로젝트에 추가할 수 있다.
- 문제와 양식 : 음성인식과 같은 것이 어떤 종류의 작업인지를, 그것으로 생성되는 데이터 종류가 어떤 것인지 설명한다. 예를 들어, 이미지 인식 시스템은 이미지들을 가져와 텍스트 레이블로 돌려준다.
- 모델 : 일반적으로 많이 사용되는 모델은 이미 T2T에 등록되어 있지만, 사용자는 더 추가할 수 있다.
- 하이퍼파라미터(hyperparameter) : 교육 프로세스를 제어하는 다양한 설정 세트를 만들 수 있다. 그래서 사용자는 필요할 때마다 그것들을 교환하거나 배치할 수 있다.
- 강사 : 실제 교육 바이너리에 전달된 파라미터를 개별적으로 지정할 수 있다.
T2T는 각 요소에 대해 기본값이 제공되기 때문에 즉각적으로 유용하게 쓰일 수 있다. T2T에는 수개의 일반적인 모델과 데이터세트가 담겨져 있어 기존 모드를 재사용하거나 확장해 신속하게 시작할 수 있으며, 필요에 따라 기본값과 수정값 가운데 하나를 배포할 수 있다.
다만 T2T는 딥 러닝 프로젝트를 구성하는 방법에 대해 텐서플로우 이외에 더 큰 콘텍스트는 제공하지 않는다. 이론적으로는 머신러닝 솔루션을 개발하기 위한 데이터에서 예측 시스템까지, 엔드투엔드의 일부가 될 수 있지만 지금은 텐서플로우를 사용하는 작업을 간단하게 만드는 것에 절대적인 가치를 두고 있다.
※ 본 내용은 한국IDG(주)(http://www.itworld.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒITWORLD. 무단전재 및 재배포 금지
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 303792 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 293675 | 2020-10-27 |
6966 | [주간 OSS 동향 리포트] 유럽 강타한 ‘페트야’ 변종 랜섬웨어 전세계로 확산 중 | 5407 | 2017-06-29 |
6965 | 패치 없이 CMS 보안을 강화하는 방법 | 5669 | 2017-06-28 |
6964 | 파워블로거 계정 탈취한 20대 해커, 10년간 독학 | 5006 | 2017-06-28 |
6963 | 부팅 막는 ‘페트야’ 변종 랜섬웨어 전 세계 확산 | 4678 | 2017-06-28 |
6962 | 러·유럽 강타한 초강력 랜섬웨어…전세계 곳곳 업무마비 | 5370 | 2017-06-28 |
6961 | 라즈베리 파이를 dnsmasq를 이용한 DNS 서버로 써야 할 3가지 이유 | 4914 | 2017-06-27 |
6960 | IBM, 유럽 주요은행 7개와 블록체인 플랫폼 구축 | 4678 | 2017-06-27 |
6959 | 구글, 오픈소스 텐서플로우 교육 도구 'T2T' 공개 | 5388 | 2017-06-27 |
6958 | 'OpenVPN'의 새로운 버전 '2.4.3', '2.3.17' 출시 | 4247 | 2017-06-27 |
6957 | [분석] 올해도 AWS·MS가 클라우드 IaaS ‘2강’…中 알리바바 영향력 커져 | 5049 | 2017-06-27 |
0개 댓글