(Python 7-1๊ฐ) pandas I
210806
Pandas
๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ๋ฅผ ์ง์ํ๋ ๋ํ์ ์ธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
panel data : pandas
๊ณ ์ฑ๋ฅarray ๊ณ์ฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ธ numpy์ ํตํฉํ์ฌ, ๊ฐ๋ ฅํโ์คํ๋ ๋์ํธโ ์ฒ๋ฆฌ๊ธฐ๋ฅ์ ์ ๊ณต
์ธ๋ฑ์ฑ, ์ฐ์ฐ์ฉํจ์, ์ ์ฒ๋ฆฌํจ์๋ฑ์์ ๊ณตํจ
๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐ ํต๊ณ๋ถ์์์ํด์ฌ์ฉ
๋ฐ์ดํฐ ์ฉ์ด
์ ์ฒด ๋ฐ์ดํฐ : Data table, Sample
์ธ๋ก์ค : attribute, field, feature, column
๊ฐ๋ก์ค : instance, tuple, row
ํ๋์ ์ธ๋ก ์ค : Featrue vector
ํ๋์ ์์ : data
๋ฐ์ดํฐ ๋ก๋ฉ
pd.read_csv
url์ ์๋ csv ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์จ๋ค
sep
: ๊ตฌ๋ถ์๋ฅผ ์๋ฏธ. ์ฌ๊ธฐ์๋ ๊ณต๋ฐฑ๋ฌธ์๋ฅผ ๊ตฌ๋ถ์๋ก ์ ํheader
: ๋ช ์์ ์ผ๋ก None์ ์ฐ๋ฉฐ ์ด ๋๋ ์ฒซ ํ์ ๋ฐ์ดํฐ๊ฐ ์ด ์ด๋ฆ์ด ๋๋ค.
Pandas์ ๊ตฌ์ฑ
Dataframe
Data Table ์ ์ฒด๋ฅผ ํฌํจํ๋ Object์ด๋ค.
Series
๋ฐ์ดํฐํ๋ ์ ์ค ํ๋์ ์ปฌ๋ผ์ ํด๋นํ๋ ๋ฐ์ดํฐ์ ๋ชจ์ Object ์ด๋ค.
Series
Dataframe
Last updated
Was this helpful?