Computer ๐Ÿ’ป/๋ฐ์ดํ„ฐ ๋ถ„์„

[๋ฐ์ดํ„ฐ ๋ถ„์„] ๋ฐ์ดํ„ฐ ํ•ฉ์น˜๊ธฐ (melt)

yeon42 2021. 7. 24. 14:55
728x90
  • ์ค‘๊ฐ„์— ๋Š๊ธฐ๋Š” (...) ๋ฐ์ดํ„ฐ(์ปฌ๋Ÿผ)๋ฅผ ๋ชจ๋‘ ๋ณด๊ณ  ์‹ถ์„ ๋•Œ ์„ค์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•
pd.options.display.max_columns = 25

 

 

* ์šฐ๋ฆฌ์˜ ๋ฐ์ดํ„ฐ df_first์™€ df_last๋Š” ์„œ๋กœ ๋‹ค๋ฅธ ํ˜•ํƒœ์ด๊ธฐ ๋•Œ๋ฌธ์— ๋‘˜์ด ํ•ฉ์น  ์ˆ˜ ์—†๋‹ค.

  -> ๋˜‘๊ฐ™์€ ํ˜•ํƒœ๋กœ ๋งŒ๋“ค์–ด์ฃผ์ž!

 

df_last
df_first

 

 

 


 

melt๋กœ Tidy data ๋งŒ๋“ค๊ธฐ

 

melt

: ์—ด์— ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ํ–‰์œผ๋กœ ๋…น์ด๊ธฐ

(column ๋ฐ์ดํ„ฐ๊ฐ’์€ ์ „์ฒ˜๋ฆฌ๊ฐ€ ์‰ฝ์ง€ ์•Š๋‹ค.)

- pandas์˜ melt๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋ฐ์ดํ„ฐ์˜ ํ˜•ํƒœ๋ฅผ ๋ณ€๊ฒฝํ•  ์ˆ˜ ์žˆ์Œ

- df_first์™€ df_last๋ฅผ ๊ฐ™์€ ํ˜•ํƒœ๋กœ ๋งŒ๋“ค์–ด์ฃผ์ž!

 

 

  • ์›๋ž˜ df_first ํ˜•ํƒœ

 

  • pd.melt ์‚ฌ์šฉ
df_first_melt(id_vars="์ง€์—ญ", var_name="๊ธฐ๊ฐ„", value_name="ํ‰๋‹น๋ถ„์–‘๊ฐ€๊ฒฉ")

- variable : var_name

- value. value_name

 

 

  • ์ปฌ๋Ÿผ ์ด๋ฆ„ ๋ณ€๊ฒฝํ•˜๊ธฐ (๊ธฐ๊ฐ„๋ช…->๊ธฐ๊ฐ„)
df_first_melt.columns = ["์ง€์—ญ๋ช…", "๊ธฐ๊ฐ„", "ํ‰๋‹น๋ถ„์–‘๊ฐ€๊ฒฉ"]