[2020년 파트-김영근개발자] pandas

scari 게시글 작성 시각 2020-07-27 21:40:27 게시글 조회수 554
글로벌 전문개발자 파트
pandas
김영근
pandas는 파이썬을 이용한 데이터 분석 라이브러리다.
2020 년
빅데이터

ㆍ주요경력

 - (현) VP Engineering, ODK Media

 - (현) PSF Fellow

 - (전) Board Director, PSF

 

ㆍ전문분야

 - 파이썬

 

ㆍ활동 커뮤니티

 - Python Software Foundation

 - SprintSeoul

 

ㆍ활동 프로젝트 분야

 - 빅데이터

 

ㆍ프로젝트명

 - pandas

 

ㆍ프로젝트 개요

 - pandas는 파이썬을 이용한 데이터 분석 라이브러리다.

 

ㆍ프로젝트 특징

 - pandas는 파이썬을 이용한 빠르고 편리한 데이터 분석을 도와주는 고수준의 자료구조를 포함한
라이브러리로, 파이썬의 산술 계산 라이브러리인 NumPy나 SciPy, 분석 라이브러리인 statsmodels,

scikit-learn, 그리고 시각화 도구인 matplotlib과 같이 쓰이는 경우가 흔하다.

pandas의 주된 자료구조는 표 형태의 행과 열 이름을 가지는 DataFrame과 1차원 배열 객체인 Series가 있다.
pandas는 반복문을 사용하지 않고 데이터를 처리한다거나 배열 기반의 함수를 제공하는 등, NumPy의 배열 기반 계산 형식을 많이 차용했다. pandas는 NumPy의 고성능과 배열 연산 아이디어를 스프레드시트와 SQL같은 관계형 데이터베이스의 유연한 데이터 처리 기능을 결합한 것이다.

세련된 색인 기능을 제공하여 데이터 변형, 자르기, 취합, 그리고 데이터의 부분 집합을 선택할 수 있도록 해준다. pandas가 해결하고자 하는 문제는 데이터 분석에서 가장 중요한 부분인, 데이터를 처리해서 준비하고 다듬는 과정이다.
Pandas가 NumPy의 스타일을 많이 차용했지만 NumPy는 단일 산술 배열 데이터를 다루는데 특화되어 있는 반면, pandas는 표 형식의 데이터나 다양한 형태의 데이터를 다루는데 맞춰 설계되었다.

 

ㆍ프로젝트 목표

 - pandas 라이브러리 개발 및 신규 컨트리뷰터 발굴

전문개발자 프로젝트 - 번호, 제목, 분야, 조회수, 작성
번호 제목 분야 조회수 작성
163 [2020년 파트-송욱개발자] NNStreamer 인공지능(AI) 592 2020-07-27
162 [2020년 파트-박현우개발자] Koalas 빅데이터 595 2020-07-27
161 [2020년 파트-이주원개발자] Johanna 클라우드 517 2020-07-27
160 [2020년 파트-박병철개발자] 리눅스 커널 기타 661 2020-07-27
159 [2020년 파트-이다니엘개발자] koNLPy 인공지능(AI) 517 2020-07-27
158 [2020년 파트-김영근개발자] pandas 빅데이터 554 2020-07-27
157 [2020년 파트-진유림개발자] Apache Zeppelin 빅데이터 594 2020-07-27
156 [2020년 파트-유태희개발자] Linux Networking Stack 클라우드 597 2020-07-27
155 [2020년 파트-박한범개발자] Uftrace 기타 513 2020-07-27
154 [2020년 파트-박경호개발자] Status/whisper 모바일 561 2020-07-27
맨 위로
맨 위로