단 두 장의 문서로 데이터 분석과 시각화 뽀개기

https://inf.run/aoz2

본문

0) 판다스 강좌 소개

1) 판다스 데이터프레임(DataFrame)과 시리즈(Series) 이해하기

2) 판다스 데이터프레임 생성하고 데이터 가져오기

3) 판다스 데이터프레임 비교연산자로 색인하기, drop_duplicates()

4) Logic in Python (and pandas) - and, or, not, xor, any, all 연산 이해하기

5) head, tail로 데이터 미리보기 df.sample(frac=0.5), df.sample(n=10), df.nlargest, df.nsmallest

6) 일부 컬럼을 기준으로 데이터 가져오기 Subset Variables (Columns)

7) 기본 통계 하기 value_counts, nunique, sum, count, mean, median

8) 판다스로 apply 활용하기 lambda 익명함수 사용하기

9) fillna, dropna로 결측치 다루기

10) assign 으로 새로운 컬럼 만들기, qcut으로 binning, bucketing 하기

11) df.sort_values, rename, sort_index, reset_index로 데이터 프레임 Reshaping 하기

12) melt, pivot 으로 Tidy Data 만들기

13) pd.concat([df1,df2]) 시리즈, 데이터프레임 합치기

14) merge로 데이터프레임 합치기 left, right, inner, outer 옵션 사용하기

15) groupby 활용하여 다양한 데이터 집계를 활용하기 시계열 데이터 분석 Windows

16) 시계열 데이터(Time Series Data) 분석을 위한 판다스 Expanding and Rolling 이해하기

17) 파이썬 판다스로 Series 와 DataFrame 데이터 시각화 하기 소개

18) 파이썬 데이터 시각화 판다스로 bar plot 막대그래프 그리기

19) 파이썬 데이터 시각화 히스토그램과 도수분포표 이해하기, 막대그래프 vs 히스토그램 차이점 이해하기

20) 파이썬 판다스로 차분 diff 값을 구하고 히스토그램으로 표현하기

21) 파이썬 시각화 상자 수염 그림(box plot) 그리기

22) 파이썬 데이터 시각화 Area plot, Grid 옵션으로 그래프 격자 만들기

23) 파이썬 데이터 시각화 scatter plot, 산점도 그리기

24) 파이썬 데이터 시각화 히스토그램과 산점도를 보완한 Hexbin plot 그리기

25) Pandas pie plot, 원 그래프, 왜 seaborn 에는 파이차트가 없을까?

26) Scatter Matrix Plot 산점도와 커널밀도함수를 함께 표현해 보도록 합니다.

27) 파이썬 시각화 분포도 그리기, Kernel Density Estimate plot 커널밀도함수, 밀도함수

실습안내와 함께보면 좋을 자료들

28) 소스코드 위치 안내와 다운로드 방법, 추가로 참고하면 좋을 자료들

29) colab(google colaboratory) 에서 github 에 있는 파이썬 판다스 실습코드를 실행해 보는 방법

판다스로 서울 코로나19 발생동향 분석하기

[0/25] 소스코드와 파일 다운로드 위치

[1/25] 판다스 단 한 줄로 서울시 코로나19 발생동향 수집하기

[2/25] 판다스로 분석해볼 내용 소개

[3/25] 판다스로 수집해 온 CSV 파일 로드하기

[4/25] 시각화를 위한 한글 폰트 설정

[5/25] 시계열 데이터 전처리

[6/25] 확진일자별 빈도 선그래프 그리기 - Pandas plot에 스타일 적용하기

[7/25] 엑셀에서는 쉽게 되는 그래프에 값 표시하기 pandas plot 에서는 어떻게 해야될까?

[8/25] 일부 데이터만 잘라서 시각화 하고 싶을때 슬라이싱 기능 사용하기

[9/25] 월단위로 확진자 추이는 어떻게 될까?

[10/25] 여러 변수의 빈도수를 구하려면?

[11/25] 확진자가 없는 날은 데이터프레임에 어떻게 만들까?

[12/25] 그래프에서 누적확진자수가 너무 커서 일별 확진자 수를 알아보기 어렵다면?

[13/25] 월별, 요일별 확진자수는 어떻게 달라졌을까?

[14/25] 거주지(구)별 확진자는 어떻게 될까?

[15/25] 빈도수가 가장 많은 감염경로는?

[16/25] 감염경로를 모르는 확진수는 월과 주별로 어느정도 차이가 있을까?

[17/25] 텍스트 안에 있는 접촉번호는 어떻게 추출해야 될까?

[18/25] 조치사항에서 퇴원여부의 빈도수 구하기

[19/25] 어느 병원에서 확진자를 가장 많이 치료했을까요?

[20/25] 해외유입은 어느 지역이 많을까요? 구별로 해외 유입 국가에 대한 차이가 있을까요?

[21/25] 일자별 해외유입 누적확진자수 구하기

[22/25] 전체 확진자중 해외 유입 비율은 구마다 얼마나 차이가 있을까요?

[23/25] 월별 해외 확진자 수 추이는?

[24/25] groupby vs crosstab vs pivot vs pivot_table 의 차이는?

[25/25] 국가별, 구별 해외 유입은 얼마나 차이가 있을까요?

(부록) 서울시 코로나19 발생현황 데이터 수집

[1/7] 서울시 코로나 발생현황 데이터 수집 준비하기

[2/7] 데이터 수집 전 로봇배제표준, 저작권, 무리한 네트워크 요청 확인하기

[3/7] 브라우저의 네트워크탭과 JSON 파일형식 이해하

[4/7] 기존의 read_html 로 데이터를 읽어올 수 없는 이유와 기존의 수집방법

[5/7] 네트워크 탭을 보는 방법과 수집할 URL 찾고 요청하

[6/7] 전체 데이터를 수집하는 함수를 만들고 반복문으로 전체 데이터 수집하기

[7/7] 데이터 전처리와 저장하고 확인하기

Last updated

Was this helpful?