Computer ๐ป/๋ฐ์ดํฐ ๋ถ์
[๋ฐ์ดํฐ ๋ถ์] ๋ฐ์ดํฐ ๋ก๋ 2 | ๋ฐ์ดํฐ ์์ฝ, ํน์ ์ปฌ๋ผ ๋ณ๊ฒฝ/์ ๊ฑฐ
yeon42
2021. 7. 18. 17:57
728x90
๋ฐ์ดํฐ ์์ฝ
df_last["OO(ใก)"].describe() -> object ๋ฐ์ดํฐ
df_last["OO"].describe() -> ์์น ๋ฐ์ดํฐ
- object ์์ฝ
- count / unique / top / freq / name
- freq : ๊ฐ์ฅ ๋น๋ฒํ๊ฒ ๋ฑ์ฅํ๋ ๋ฌธ์(object)๊ฐ ๋ช ๋ฒ ๋ฑ์ฅํ๋์ง
- ์์น ๋ฐ์ดํฐ ์์ฝ
- count / mean / std / min / 25% / 50% / 75% / name
์ปฌ๋ผ๊ฐ ๋ณ๊ฒฝ
df_last["OO"] = df_last["OO"].str.replace("OO", "")
df_last["OO"] = df_last["OO"].str.replace(" ", "").str.strip()
- replace : ํ
์คํธ๊ฐ ์์ ํ ์ผ์นํด์ผ๋ง ๋ฐ๋๋ฏ๋ก string method๋ฅผ ์ฌ์ฉํจ
- str.strip() : ์๋ค์ ๊ณต๋ฐฑ ์ ๊ฑฐํด์ค
- ๋ฐ๋ณต๋๋ ํ
์คํธ ์ ๊ฑฐํ๋ฉด ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ด ์ค์ ๊ฒ์ด๋ค.
์ปฌ๋ผ ์ ๊ฑฐ
df_last = df_last.drop(["OO", "OO(ใก)"], axis=1)
- axis์ ๊ธฐ๋ณธ๊ฐ์ 0, ์ฆ ํ์ ๋ํ๋ด๋ฏ๋ก, ํน์ ์ด(์ปฌ๋ผ)์ ์ ๊ฑฐํ๊ณ ์ถ๋ค๋ฉด 'axis=1'
- ํ์์๋ ์ปฌ๋ผ์ ์ ๊ฑฐ๋ฅผ ํตํด ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ด ์ค์ ๊ฒ์ด๋ค.