1 Fri
TIL
[인프런] 단 두 장의 문서로 데이터 분석과 시각화 뽀개기
판다스 데이터프레임과 시리즈 이해하기 - Syntax
import pandas as pddf = pd.DataFrame(
{"a" : [4, 5, 6],
"b" : [7, 8, 9],
"c" : [10, 11, 12]},
index = [1, 2, 3])기본적인 데이터 프레임 조작
df판다스 데이터프레임 생성하고 데이터 가져오기 - Syntax
판다스 데이터프레임 비교연산자로 색인하기 - Subset Observations(Rows)
특정 열에서 색인(필터링)
df.drop_duplicates() : 중복을 없애주는 메서드
정리 : drop_duplicates는 중복된 행을 제거할 때 사용한다.
Logic in Python - Subset Observations(Rows)
isin() : 행에 대한 인자의 존재 유무
isnull() : null값의 존재 유무 확인
notnull : null이 아닌 값의 존재 유무
and, or, not, xor, any, all
head, tail, sample로 데이터 미리보기 - Subset Observations(Rows)
df.head() : 위에서 n개 출력
df.tail() : 아래에서 n개 출력
df.sample(frac=0.5)
df.sample(n=10)
비율로 구할 때에는 frac, 개수로 구할 때에는 n
iloc, nlargest, nsmallest로 데이터 색인하기 - Subset Observations(Rows)
df.iloc[:]
df.nlargest(n, 'value')
df.nsmallest(n, 'value')
Last updated