단 두 장의 문서로 데이터 분석과 시각화 뽀개기

https://inf.run/aoz2

본문

0) 판다스 강좌 소개arrow-up-right

1) 판다스 데이터프레임(DataFrame)과 시리즈(Series) 이해하기arrow-up-right

2) 판다스 데이터프레임 생성하고 데이터 가져오기arrow-up-right

3) 판다스 데이터프레임 비교연산자로 색인하기, drop_duplicates()arrow-up-right

4) Logic in Python (and pandas) - and, or, not, xor, any, all 연산 이해하기arrow-up-right

5) head, tail로 데이터 미리보기 df.sample(frac=0.5), df.sample(n=10), df.nlargest, df.nsmallestarrow-up-right

6) 일부 컬럼을 기준으로 데이터 가져오기 Subset Variables (Columns)arrow-up-right

7) 기본 통계 하기 value_counts, nunique, sum, count, mean, medianarrow-up-right

8) 판다스로 apply 활용하기 lambda 익명함수 사용하기arrow-up-right

9) fillna, dropna로 결측치 다루기arrow-up-right

10) assign 으로 새로운 컬럼 만들기, qcut으로 binning, bucketing 하기arrow-up-right

11) df.sort_values, rename, sort_index, reset_index로 데이터 프레임 Reshaping 하기arrow-up-right

12) melt, pivot 으로 Tidy Data 만들기arrow-up-right

13) pd.concat([df1,df2]) 시리즈, 데이터프레임 합치기arrow-up-right

14) merge로 데이터프레임 합치기 left, right, inner, outer 옵션 사용하기arrow-up-right

15) groupby 활용하여 다양한 데이터 집계를 활용하기 시계열 데이터 분석 Windowsarrow-up-right

16) 시계열 데이터(Time Series Data) 분석을 위한 판다스 Expanding and Rolling 이해하기arrow-up-right

17) 파이썬 판다스로 Series 와 DataFrame 데이터 시각화 하기 소개arrow-up-right

18) 파이썬 데이터 시각화 판다스로 bar plot 막대그래프 그리기arrow-up-right

19) 파이썬 데이터 시각화 히스토그램과 도수분포표 이해하기, 막대그래프 vs 히스토그램 차이점 이해하기arrow-up-right

20) 파이썬 판다스로 차분 diff 값을 구하고 히스토그램으로 표현하기arrow-up-right

21) 파이썬 시각화 상자 수염 그림(box plot) 그리기arrow-up-right

22) 파이썬 데이터 시각화 Area plot, Grid 옵션으로 그래프 격자 만들기arrow-up-right

23) 파이썬 데이터 시각화 scatter plot, 산점도 그리기arrow-up-right

24) 파이썬 데이터 시각화 히스토그램과 산점도를 보완한 Hexbin plot 그리기arrow-up-right

25) Pandas pie plot, 원 그래프, 왜 seaborn 에는 파이차트가 없을까?arrow-up-right

26) Scatter Matrix Plot 산점도와 커널밀도함수를 함께 표현해 보도록 합니다.arrow-up-right

27) 파이썬 시각화 분포도 그리기, Kernel Density Estimate plot 커널밀도함수, 밀도함수arrow-up-right

실습안내와 함께보면 좋을 자료들

28) 소스코드 위치 안내와 다운로드 방법, 추가로 참고하면 좋을 자료들

29) colab(google colaboratory) 에서 github 에 있는 파이썬 판다스 실습코드를 실행해 보는 방법

판다스로 서울 코로나19 발생동향 분석하기

[0/25] 소스코드와 파일 다운로드 위치arrow-up-right

[1/25] 판다스 단 한 줄로 서울시 코로나19 발생동향 수집하기arrow-up-right

[2/25] 판다스로 분석해볼 내용 소개arrow-up-right

[3/25] 판다스로 수집해 온 CSV 파일 로드하기arrow-up-right

[4/25] 시각화를 위한 한글 폰트 설정arrow-up-right

[5/25] 시계열 데이터 전처리arrow-up-right

[6/25] 확진일자별 빈도 선그래프 그리기 - Pandas plot에 스타일 적용하기arrow-up-right

[7/25] 엑셀에서는 쉽게 되는 그래프에 값 표시하기 pandas plot 에서는 어떻게 해야될까?arrow-up-right

[8/25] 일부 데이터만 잘라서 시각화 하고 싶을때 슬라이싱 기능 사용하기arrow-up-right

[9/25] 월단위로 확진자 추이는 어떻게 될까?arrow-up-right

[10/25] 여러 변수의 빈도수를 구하려면?arrow-up-right

[11/25] 확진자가 없는 날은 데이터프레임에 어떻게 만들까?arrow-up-right

[12/25] 그래프에서 누적확진자수가 너무 커서 일별 확진자 수를 알아보기 어렵다면?arrow-up-right

[13/25] 월별, 요일별 확진자수는 어떻게 달라졌을까?arrow-up-right

[14/25] 거주지(구)별 확진자는 어떻게 될까?arrow-up-right

[15/25] 빈도수가 가장 많은 감염경로는?arrow-up-right

[16/25] 감염경로를 모르는 확진수는 월과 주별로 어느정도 차이가 있을까?arrow-up-right

[17/25] 텍스트 안에 있는 접촉번호는 어떻게 추출해야 될까?arrow-up-right

[18/25] 조치사항에서 퇴원여부의 빈도수 구하기arrow-up-right

[19/25] 어느 병원에서 확진자를 가장 많이 치료했을까요?arrow-up-right

[20/25] 해외유입은 어느 지역이 많을까요? 구별로 해외 유입 국가에 대한 차이가 있을까요?arrow-up-right

[21/25] 일자별 해외유입 누적확진자수 구하기arrow-up-right

[22/25] 전체 확진자중 해외 유입 비율은 구마다 얼마나 차이가 있을까요?arrow-up-right

[23/25] 월별 해외 확진자 수 추이는?arrow-up-right

[24/25] groupby vs crosstab vs pivot vs pivot_table 의 차이는?arrow-up-right

[25/25] 국가별, 구별 해외 유입은 얼마나 차이가 있을까요?arrow-up-right

(부록) 서울시 코로나19 발생현황 데이터 수집

[1/7] 서울시 코로나 발생현황 데이터 수집 준비하기arrow-up-right

[2/7] 데이터 수집 전 로봇배제표준, 저작권, 무리한 네트워크 요청 확인하기arrow-up-right

[3/7] 브라우저의 네트워크탭과 JSON 파일형식 이해하arrow-up-right

[4/7] 기존의 read_html 로 데이터를 읽어올 수 없는 이유와 기존의 수집방법arrow-up-right

[5/7] 네트워크 탭을 보는 방법과 수집할 URL 찾고 요청하arrow-up-right

[6/7] 전체 데이터를 수집하는 함수를 만들고 반복문으로 전체 데이터 수집하기arrow-up-right

[7/7] 데이터 전처리와 저장하고 확인하기arrow-up-right

Last updated