Computer ๐ป/๋ฐ์ดํฐ ๋ถ์
[๋ฐ์ดํฐ ๋ถ์] ๋ฐ์ดํฐ ํฉ์น๊ธฐ (melt)
yeon42
2021. 7. 24. 14:55
728x90
- ์ค๊ฐ์ ๋๊ธฐ๋ (...) ๋ฐ์ดํฐ(์ปฌ๋ผ)๋ฅผ ๋ชจ๋ ๋ณด๊ณ ์ถ์ ๋ ์ค์ ํ๋ ๋ฐฉ๋ฒ
pd.options.display.max_columns = 25
* ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ df_first์ df_last๋ ์๋ก ๋ค๋ฅธ ํํ์ด๊ธฐ ๋๋ฌธ์ ๋์ด ํฉ์น ์ ์๋ค.
-> ๋๊ฐ์ ํํ๋ก ๋ง๋ค์ด์ฃผ์!
melt๋ก Tidy data ๋ง๋ค๊ธฐ
melt
: ์ด์ ์๋ ๋ฐ์ดํฐ๋ฅผ ํ์ผ๋ก ๋ น์ด๊ธฐ
(column ๋ฐ์ดํฐ๊ฐ์ ์ ์ฒ๋ฆฌ๊ฐ ์ฝ์ง ์๋ค.)
- pandas์ melt๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐ์ ํํ๋ฅผ ๋ณ๊ฒฝํ ์ ์์
- df_first์ df_last๋ฅผ ๊ฐ์ ํํ๋ก ๋ง๋ค์ด์ฃผ์!
- ์๋ df_first ํํ
- pd.melt ์ฌ์ฉ
df_first_melt(id_vars="์ง์ญ", var_name="๊ธฐ๊ฐ", value_name="ํ๋น๋ถ์๊ฐ๊ฒฉ")
- variable : var_name
- value. value_name
- ์ปฌ๋ผ ์ด๋ฆ ๋ณ๊ฒฝํ๊ธฐ (๊ธฐ๊ฐ๋ช ->๊ธฐ๊ฐ)
df_first_melt.columns = ["์ง์ญ๋ช ", "๊ธฐ๊ฐ", "ํ๋น๋ถ์๊ฐ๊ฒฉ"]