“AI의 성패, 개방형 데이터 활용에 달렸다”
11월 14일
ⓒ지디넷코리아, 권봉석 기자 | bskwon@zdnet.co.kr
[ATS 2019] 앤디 워로마 클라우드컴래드 CEO
“많은 AI 프로젝트 중 50% 가량은 사실 실패한다. 아무리 좋은 알고리즘을 개발해도 여기에 힘을 싣는데는 좋은 데이터, 정확한 데이터가 필요하다. 보통 1만 개에 이르는 데이터 포인트가 있어야 AI나 머신러닝 알고리즘을 검증 가능하며 이를 통해 인사이트를 이끌어 낼 수 있다.”
14일 지디넷코리아가 서울 포시즌즈호텔에서 주최한 아시아테크서밋(ATS 2019)에 클로징 키노트 연사로 나선 클라우드컴래드 앤디 워로마 CEO의 말이다. 그는 지난 해 오픈소스 소프트웨어의 중요성을 강조한 데 이어 올해 개방형 데이터의 중요성을 역설했다.
앤디 워로마 CEO는 “자신은 클라우드컴래드 뿐만 아니라 유러피언 클라우드 얼라이언스의 일원으로 여러 사업자와 개발사, 벤더 등을 대표해 클라우드 플랫폼에 대한 우려와 정책 등을 공공 기관에 전달하는 한편 성공 사례(베스트 프랙티스)를 공개하는 활동을 진행 중”이라고 소개했다.
■ “개방형 데이터, 많은 잠재력 지녔다”
폐쇄형 데이터는 사기업이 보유하고 공개하지 않는 상용 데이터이며 이를 통해 매출이 발생할 수 있다. 앤디 워로마 CEO는 구글의 예를 들며 “비록 이용자가 직접 돈을 내지는 않지만 구글은 이들 이용자들이 검색과 유튜브 시청 등을 통해 발생시킨 데이터를 기반으로 광고주에게서 수익을 거둔다”고 소개했다.
2016년에는 픽셀 스마트폰 전용 VR 헤드셋인 데이드림 뷰도 내놨다. 직물(패브릭) 소재를 적용해 착용시 부담을 덜었고 리모컨을 이용해 간단한 조작이 가능해 편의성도 향상시켰다.
반면 개방형 데이터는 정부 기관이나 비영리단체, 교육기관과 일부 사기업 등이 생성해 이를 필요로 하는 이들에게 무료로 공개된다. 비용 청구는 물론 ID나 비밀번호를 통해 접근이 가로막히지도 않는다.
앤디 워로마 CEO는 “개방형 데이터는 AI와 머신러닝을 통한 혁신의 최전방에 있으며 많은 잠재력과 경제적 가치를 지녔다. 또 개방형 데이터를 활용해 산업 간 간극을 메울 수 있다”고 강조했다.
■ “공공 영역 데이터, 알고리즘 개발에 도움 될 것”
그러나 AI를 위한 알고리즘을 만드는 데 가장 중요한 것은 바로 데이터다. 앤디 워로마 CEO는 “구글이 지닌 좋은 알고리즘이 양질의 데이터를 모으는 데 도움을 주었고 이를 바탕으로 더 나은 제품이 나오고, 더 많은 소비자가 몰리면서 데이터가 모이는 선순환 효과를 낳았다”고 강조했다.
또 “오픈소스 소프트웨어를 이용해 신규 개발에 필요한 자원을 줄일 수 있는 것처럼 정부나 공공 영역이 지닌 다양한 개방형 데이터가 알고리즘 개발에 도움을 줄 수 있다”고 밝혔다.
실제로 현재 각국 정부는 개방형 데이터 포털을 만들어서 날씨나 교통 정보 등 행정 정보를 적극적으로 공개하고 있다. 또 월드와이드웹 재단이 최근 각국 정부의 데이터 개방도를 평가한 결과 한국은 캐나다 등에 이어 5위를 차지했다.
■ "개방형 데이터 활용, 프라이버시 보호 등 고려해야"
그러나 개방형 데이터 활용에는 프라이버시 보호와 법적 제도 등 고려해야 할 점도 많다. 앤디 워로마 CEO는 “게놈 데이터 그 자체로는 많은 데이터를 얻어내지 못하지만 이를 바탕으로 병력이나 유전적 요인 등을 이용해 보험 가입을 거부하는 등의 사례가 일어나면 불행할 것”이라며 데이터의 악용 가능성도 염두에 두어야 한다고 발했다.
또 데이터를 주고받는 양단간의 암호화는 물론 변조 등을 막을 수 있는 수단도 확보되어야 한다. 아울러 공공기관의 경우 어떤 데이터를 얼마나 공개할 것인지, 또 어떤 데이터를 어느 저장소에 분산해 보관할 지에 대한 정책도 미리 결정해야 한다.
앤디 워로마 CEO는 “싱가포르 정부의 경우 수 년 전 데이터를 모두 분류해 개인정보 등 민감한 데이터는 퍼블릭 클라우드에 저장할 수 없도록 정책을 결정했다”며 마이크로소프트 애저를 활용한 사례를 소개했다.
“싱가포르 정부 부처가 개방형 데이터를 공유할 때는 각종 제약과 요구 조건들을 설정한다. 이를 받아들이지 않으면 정보 공유가 아예 불가능하다. 데이터 공유는 스트리밍 형식으로 이뤄지며 데이터 공유를 중단해야 할 경우, 혹은 데이터를 악용한다고 판단될 경우 언제든지 데이터 공유를 중단할 수 있다.”
■ “알고리즘 고도화 위해 개방형 데이터 적극 활용하라”
앤디 워로마 CEO는 마지막으로 “혁신의 미래는 데이터에서 출발할 것이다. 앞으로도 AI와 머신러닝은 우리와 함께 할 것이다. 알고리즘 고도화를 위해 양질의 데이터를 어떻게 확보해야 할지 고심해야 한다. 조직 내에 갖추고 있는 데이터 뿐만 아니라 개방형 데이터도 적극적으로 확보하라. 이미 정부와 비영리기관(NGO) 뿐만 아니라 일부 기업도 개방형 데이터 제공에 나서고 있고 여러분들이 추구하고자 하는 혁신에 날개를 달아 줄 것”이라고 조언했다.
※ 본 내용은 (주)메가뉴스(http://www.zdnet.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒ 지디넷코리아. 무단전재 및 재배포 금지
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
공지 | [Open UP 활용가이드] 공개SW 활용 및 개발, 창업, 교육 "Open UP을 활용하세요" | 429840 | 2020-10-27 |
공지 | [Open UP 소개] 공개SW 개발·공유·활용 원스톱 지원 Open UP이 함께합니다 | 417942 | 2020-10-27 |
8739 | 페이스북 페이, 리브라와 다른 점은 | 4716 | 2019-11-17 |
8738 | '2019 동북아 공개SW 컨퍼런스' 21일 열려 file | 4800 | 2019-11-17 |
8737 | “AI의 성패, 개방형 데이터 활용에 달렸다” | 4494 | 2019-11-17 |
8736 | [Tech & BIZ] AI·블록체인 입고 더 똑똑해진 '오피스 SW' | 4888 | 2019-11-17 |
8735 | 빗썸 글로벌, 자체 가상화폐 '빗썸코인' 선보인다 | 4386 | 2019-11-14 |
8734 | 소비자 외면 속 초라하게 저무는 모바일 VR 시장 file | 4504 | 2019-11-14 |
8733 | 크롬 강세 속 네이버 웨일 선전…'고래의 꿈'은 지금부터 시작된다 | 4474 | 2019-11-13 |
8732 | 서양 게임시장은 '블루오션'…"공략하려면 그들의 '표준'을 파악하라" | 4715 | 2019-11-13 |
8731 | 지속가능한 오픈소스를 위한 3가지 모델 file | 5350 | 2019-11-12 |
8730 | 국제 리눅스 자격증 시험도 한국어로…LPIC 국내 진출 file | 5302 | 2019-11-10 |
0개 댓글