22 Sat
Last updated
Was this helpful?
Last updated
Was this helpful?
โโ
โโ
pd.read_html(url)
url์ ์๋ html ํ๊ทธ๋ฅผ ์ฝ์ด ํ๋ค์ค ๋ฐ์ดํฐํ๋ ์ ํ์ ์ผ๋ก ๋ฐํํ๋ค.
๊ฐ๋จํ ์๊ฐ
pd.read_csv(file_name)
csv ํ์ผ์ ์ฝ๋ ํจ์
encoding
์ utf-8๊ณผ cp949 ๋ฑ์ด ์๋ค.
์ธ์ฝ๋ฉ์ ๋ง๊ฒ ์ฝ๊ณ ์ฐ์ง ์์ผ๋ฉด ์๋ฌ๊ฐ ๋๋ค
Sort
df.sort_values
๊ฐ์ผ๋ก ์ ๋ ฌ
df.sort_indexs
์ธ๋ฑ์ค๋ก ์ ๋ ฌ
๋ํ, shift+tab์ ๋๋ฅด๋ฉด ์๋์์ฑ์ ์ด์ฉํ ์ ์๋ค
pd.Series.plot()
: ์ ๊ทธ๋ํ
pd.Series.plot.bar(tilte="")
: ๋ง๋ ๊ทธ๋ํ
์ด ๋, ํ๊ธ์ ์ฌ์ฉํ ๊ฒฝ์ฐ ํ๊ธ์ด ๊นจ์ง ์ ์๋ค. ์ด๋ด ๊ฒฝ์ฐ์๋ ๋ค์๊ณผ ๊ฐ์ด ํด์ผํ๋ค.
๋ํ, -2, -4์ ๊ฐ์ ์์๊ฐ์ ๋ํด -
๊ธฐํธ๊ฐ ๊นจ์ง๋ ๊ฒฝ์ฐ๊ฐ ์๋๋ฐ ์ด๋ ๋ค์ ์ฝ๋๋ก ํด๊ฒฐํ๋ค
์๊ฐํ ํฐํธ๋ฅผ ๋ ์ ๋ช ํ๊ฒ ๋ณด๋ ๋ฐฉ๋ฒ๋ ์๋ค.
์ด ๋ retina ๋์คํ๋ ์ด๊ฐ ์ง์๋๋ ํ๊ฒฝ์์๋ง ์ฐจ์ด๋ฅผ ๋๋ ์ ์๋ค.
df.value_counts()
object ํ์ ์ ๋ํ ๊ฐ์ ์ ๋ ์ฃผ๋ก ์ฌ์ฉํ๋ค.
์์นํ๋ ๊ฐ๋ฅํ๊ธฐ๋ ํ๋ค.
df.replace('A', 'B')
df.replace('A', 'B')
๋ df๊ฐ 'A'์ ์์ ํ ๋์ผํด์ผ B๋ก ์นํ๋๋ค.
df๊ฐ 30์ผ ๋ 60์ผ๋ก ๋ฐ๊พธ๋ ค๋ ๊ฒฝ์ฐ๋ง ๊ฐ๋ฅํ๋ค.
df๊ฐ 30- ์ผ ๋ 60. ์ผ๋ก ๋ฐ๊พธ๋ ๊ฒฝ์ฐ๋ ๋ถ๊ฐ๋ฅ ํ๋ค.
๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๊ฐ 6.30. ์ 6-30- ์ผ๋ก ๋ฐ๊พธ๊ณ ์ถ์ ๋๊ฐ ์๋ค. ์ด๋ด ๋๋ df.str.replace()
๋ฅผ ์ฌ์ฉํ๋ฉด ๋๋ค. df.str์ ํ์ด์ฌ์ ๋ฌธ์์ด ํจ์๋ฅผ ์ฌ์ฉํ ์ ์๋๋ก ํ๋ค
pd.to_datetime('A')
A๋ฅผ ๋ฐ์ดํฐํ๋ ์์ ์๋ฃํ ์ค ํ๋์ธ datetime์ผ๋ก ์บ์คํ ํ๋ค.
์ด ๊ฒฝ์ฐ datetime์ attribute์ ์ ๊ทผํ ์ ์๋ค.
df.month
df.year
df.week
๋ฑ๋ฑ