Computer ๐Ÿ’ป/๋ฐ์ดํ„ฐ ๋ถ„์„

[๋ฐ์ดํ„ฐ ๋ถ„์„] ๋ฐ์ดํ„ฐ ๋กœ๋“œ 2 | ๋ฐ์ดํ„ฐ ์š”์•ฝ, ํŠน์ • ์ปฌ๋Ÿผ ๋ณ€๊ฒฝ/์ œ๊ฑฐ

yeon42 2021. 7. 18. 17:57
728x90
๋ฐ์ดํ„ฐ ์š”์•ฝ
df_last["OO(ใŽก)"].describe() -> object ๋ฐ์ดํ„ฐ
df_last["OO"].describe() -> ์ˆ˜์น˜ ๋ฐ์ดํ„ฐ
  • object ์š”์•ฝ

- count / unique / top / freq / name
- freq : ๊ฐ€์žฅ ๋นˆ๋ฒˆํ•˜๊ฒŒ ๋“ฑ์žฅํ•˜๋Š” ๋ฌธ์ž(object)๊ฐ€ ๋ช‡ ๋ฒˆ ๋“ฑ์žฅํ•˜๋Š”์ง€

  • ์ˆ˜์น˜ ๋ฐ์ดํ„ฐ ์š”์•ฝ

- count / mean / std / min / 25% / 50% / 75% / name



์ปฌ๋Ÿผ๊ฐ’ ๋ณ€๊ฒฝ
df_last["OO"] = df_last["OO"].str.replace("OO", "")
df_last["OO"] = df_last["OO"].str.replace(" ", "").str.strip()

- replace : ํ…์ŠคํŠธ๊ฐ€ ์™„์ „ํžˆ ์ผ์น˜ํ•ด์•ผ๋งŒ ๋ฐ”๋€Œ๋ฏ€๋กœ string method๋ฅผ ์‚ฌ์šฉํ•จ
- str.strip() : ์•ž๋’ค์˜ ๊ณต๋ฐฑ ์ œ๊ฑฐํ•ด์คŒ
- ๋ฐ˜๋ณต๋˜๋Š” ํ…์ŠคํŠธ ์ œ๊ฑฐํ•˜๋ฉด ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์ด ์ค„์„ ๊ฒƒ์ด๋‹ค.



์ปฌ๋Ÿผ ์ œ๊ฑฐ
df_last = df_last.drop(["OO", "OO(ใŽก)"], axis=1)

- axis์˜ ๊ธฐ๋ณธ๊ฐ’์€ 0, ์ฆ‰ ํ–‰์„ ๋‚˜ํƒ€๋‚ด๋ฏ€๋กœ, ํŠน์ • ์—ด(์ปฌ๋Ÿผ)์„ ์ œ๊ฑฐํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด 'axis=1'
- ํ•„์š”์—†๋Š” ์ปฌ๋Ÿผ์˜ ์ œ๊ฑฐ๋ฅผ ํ†ตํ•ด ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์ด ์ค„์„ ๊ฒƒ์ด๋‹ค.