본문 바로가기

[기획] 오픈소스 데이터 시각화 도구 TOP 4

support 게시글 작성 시각 2023-01-20 14:56:31

 

오픈소스 데이터 시각화 도구 TOP 4

 

-openup-

 

 

최근 빅데이터 기술시장의 성장과 함께 시각화 기술도 중요한 기술요소로 자리 잡고 있다. 분석하고자 하는 데이터가 무엇이든 데이터 시각화는 필수적인 단계가 됐고 시각화를 통해 빠르고 효과적으로 데이터를 이해할 수 있다. 새로운 인사이트를 더 쉽게 볼 수 있으며 의사결정을 내리는 데도 결정적인 역할을 한다.

 

직관적인 형식의 데이터 시각화는 강력한 방법으로 보다 쉬운 협업과 더 빠른 혁신을 가능하게 한다.

다음과 같이 대표적인 4개의 오픈소스 데이터 시각화 도구를 소개한다.

 

 

1. D3.js

 

D3는 Data Driven Documents의 약자로, 데이터를 중심으로 document를 조작하는 자바스크립트 라이브러리다. D3는 HTML, CSS 그리고 SVG로 데이터를 시각화 프레임워크로 많이 활용된다.

 

D3의 가장 주요한 특징은 메서드 체이닝을 활용하여 우리가 원하는 시각화를 SVG로 쉽게 그려낼 수 있다.

이로 인해, SVG가 가지는 장점을 그대로 갖게 된다. 메서드 체이닝으로 필요한 변수들을 쉽게 추가 가능하며 메서드들의 나열을 쭉 읽었을 때 직관적으로 해당 코드를 이해할 수 있다.

 

과거 단순하게 차트로 처음 페이지가 열릴 때 한 번만 출력하는 고정된 형태였다면 D3.js는 고정된 시각화에 그치지 않고 실시간 갱신을 통해 보다 생감 있는 시각화 문서를 만들 수 있도록 도와주는 API함수들을 제공하고 있다.

D3.js를 사용하면 초보들도 충분히 독학으로 데이터 시각화 문서를 만들 수 있다.

[D3.js 사용 샘플]
출처: https://spin.atomicobject.com/2013/08/12/d3-javascript-data-visualization/

 

 

2. Matplotlib

 

Matplotlib는 Python 프로그래밍 언어 및 수학적 확장 NumPy 라이브러리를 활용한 플로팅 라이브러리이다.

 

Python에서 데이터를 차트나 plot으로 시각화해주는 라이브러리 패키지이다. 데이터 분석 시각화에 많이 쓰였던 MATLAB 형태의 그래프를 그릴 수 있다. 라인plot, 바, 차트, pie차트, 히스토그램, boxplot, scatterplot 등 다양한 차트와 plot 스타일을 지원한다.

 

Matplotlib은 기본적으로 numpy와 scipy를 베이스로 한다. 이로 인해 다양한 라이브러리(Scikit-Learn, PyTorch, TensorFlow, Pandas)와 호환성이 좋다는 장점이 있으며 그래프 세부조정이 가능하다.

 

위와 같은 기능으로 그래프를 한 번에 다 그리지 않고 그때그때 수정해가면서 그릴 수 있다.


[Matplotlib 사용 샘플]
출처: https://www.educba.com/matplotlib-in-python/

 

 

3. Leaflet

 

Leaflet는 2010년에 Vladimir Agafonkin에 의해 개발되었으며, 2011년에 처음으로 출시되었다. 그 후, 지속적인 업데이트와 개선이 이루어져 현재 많은 개발자들이 사용하고 있으며 Leaflet은 MIT 라이선스를 따르고 있어, 누구나 자유롭게 사용 및 수정할 수 있다.

 

Leaflet는 오픈소스 웹 맵 라이브러리로서, 웹 개발자들이 매우 쉽게 인터랙티브 맵을 만들 수 있게 도와준다.Leaflet를 사용하면 다양한 기능을 가진 맵을 만들 수 있으며, 사용자 정의 가능한 맵 레이아웃을 사용할 수 있다.

Leaflet는 간결하면서도 사용하기 쉬운 API를 제공하여, 개발자들이 맵을 쉽게 생성, 커스터마이즈, 디자인할 수 있다. 이를 위해 HTML, CSS, JavaScript 등을 활용한다. 또한, 다양한 플러그인을 제공하여 지도에 다양한 기능을 추가할 수 있다.

[Leaflet]
출처:
https://leafletjs.com/

 

Leaflet은 반응형 웹 디자인을 지원하며, 모바일 환경에서도 사용이 가능하다. 또한 다양한 타일맵과 웹 맵 서비스와 통합이 가능하여, 다양한 지도 정보를 활용할 수 있다.
Leaflet는 맵 데이터를 다양한 형식으로 가져오는 것을 지원한다. GeoJSON, KML, GPX, CSV 등의 데이터 형식을 지원하여, 데이터 시각화에 유용하게 사용될 수 있다.

 

3. Open Refine

 

오픈소스 데이터 시각화도구 Open Refine(오픈 리파인)는 데이터 정제와 변환, 그리고 시각화를 위한 편리한 도구이다. Open Refine은 구글 Refine이라는 이름으로 시작하여 2010년에 출시되었으며, 2012년부터 오픈소스로 공개되어 무료로 사용할 수 있게 되었다.

 

Open Refine을 사용하면 대용량 데이터를 쉽게 읽고, 데이터셋을 분석하고, 데이터를 정제하고, 이를 시각화할 수 있으며 Open Refine은 데이터 불일치성을 감지하고 이를 처리할 수 있는 기능을 제공한다.
CSV, TSV, Excel, JSON 등의 다양한 파일 형식을 지원하며, 강력한 필터링 및 분류 기능을 이용하여 데이터를 빠르게 탐색하고 이상한 값이나 누락된 값, 오류가 있는 데이터 등을 찾아낼 수 있다.

 

데이터를 정제하기 위해서는 다양한 기능을 이용할 수 있다. 데이터 분할, 텍스트 분석, 표준화, 교정, 유효성 검사, 변환 등의 기능을 통해 데이터를 보다 정확하고 일관성 있게 만들 수 있다.

 

[Open Refine]
출처:
https://openrefine.org/

 

Open Refine은 히스토그램, 막대 그래프, 산점도, 지도 등 다양한 그래프와 차트를 제공하여 데이터를 직관적으로 이해할 수 있으며 확장 가능한 플러그인 구조를 갖추고 있어 필요에 따라 기능을 확장할 수 있다.

Open Refine은 최근에도 활발한 개발과 커뮤니티 활동이 이루어지고 있으며, 오픈소스 생태계에서 중요한 데이터 시각화 도구 중 하나로 인기를 얻고 있다.

 


 

※ 참고자료


 1) https://leafletjs.com/
 2) https://snowjang24.github.io/d3-js1.html
 3) https://velog.io/@ausrn731/%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5-Python-Matplotlib
 4) https://hwi-doc.tistory.com/entry/matplotlib-%EC%99%84%EB%B2%BD-%EC%A0%95%EB%A6%AC
 5) https://blog.naver.com/hansoo0724/222675739062
 6) https://openrefine.org/ 


 

.
.
2023
공개SW 가이드/보고서 - 번호, 제목, 작성자, 조회수, 작성
번호 제목 작성자 조회수 작성
공지 [2024년] 오픈소스SW 라이선스 가이드 개정판 발간 file support 13442 2024-01-03
공지 [2024년] 기업 오픈소스SW 거버넌스 가이드 개정판 발간 file support 10982 2024-01-03
공지 [2024년] 공공 오픈소스SW 거버넌스 가이드 개정판 발간 file support 10805 2024-01-03
공지 공개 소프트웨어 연구개발(R&D) 실무 가이드라인 배포 file support 23259 2022-07-28
공지 공개소프트웨어 연구개발 수행 가이드라인 file OSS 21589 2018-04-26
451 [4월 월간브리핑] 오픈소스 NFT 최근 산업 동향 support 7032 2023-04-24
450 [기획] 3D 프린팅을 위한 오픈소스 소프트웨어 support 4578 2023-03-27
449 [기획기사] 3D 프린터의 보안 위협과 오픈소스 해결책 support 1835 2023-03-27
448 [3월 월간브리핑] 3D 프린팅의 흐름을 바꾼 오픈소스 프로젝트 support 7329 2023-03-27
447 [기획] OpenAI-ChatGPT의 오픈소스 대안 support 8570 2023-02-20
446 [기획기사] 최근 자연어 처리 (NLP) 오픈소스 기술 현황 support 8575 2023-02-20
445 [2월 월간 브리핑] 한국어 자연어 처리(NLP) 오픈소스 프로젝트 support 12977 2023-02-20
444 [기획기사] 실시간 데이터 처리 분석 붐 중심에 선 오픈소스 support 3961 2023-01-20
443 [1월 월간 브리핑] 하둡을 잇는 오픈소스 분석 시장 신흥 강자 기술들 support 4196 2023-01-20
442 [기획] 오픈소스 데이터 시각화 도구 TOP 4 support 10722 2023-01-20
맨 위로
맨 위로