Notice
Recent Posts
Recent Comments
Link
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- ๋ฅ๋ฌ๋
- ์ ํ๋์ํ
- cs231n
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- ๋ฐ์ดํฐ๋ถ์
- Git
- ๋ฐฑ์ค
- Titanic
- ๋์
- Kaggle
- ํ์ดํ๋
- ๊นํ
- c++
- linearalgebra
- react
- ์๋ฒ ๋ฉ
- ๋ถ์
- ์ธํ๋ฐ
- AI
- ๋ฆฌ์กํธ
- nlp
- native
- ๋ฐ์ดํฐ
- ๋ค์ดํฐ๋ธ
- ์ํ์ฝ๋ฉ
- ๋ฐ์ดํฐ์๊ฐํ
- ์๋๋ก์ด๋์คํ๋์ค
- ๊ฒฐ์ ํธ๋ฆฌ
- ์๊ณ ๋ฆฌ์ฆ
- ๋จธ์ ๋ฌ๋
Archives
- Today
- Total
yeon's ๐ฉ๐ป๐ป
[๋ฐ์ดํฐ ๋ถ์] ๋ฐ์ดํฐ ์ง๊ณ | groupby, pivot table ๋ณธ๋ฌธ
Computer ๐ป/๋ฐ์ดํฐ ๋ถ์
[๋ฐ์ดํฐ ๋ถ์] ๋ฐ์ดํฐ ์ง๊ณ | groupby, pivot table
yeon42 2021. 7. 19. 19:39728x90
๋ฐ์ดํฐ ์ง๊ณํ๊ธฐ (groupby & pivot_table ๋น๊ต)
- ์ง์ญ๋ช ์ผ๋ก ๋ถ์๊ฐ๊ฒฉ์ ํ๊ท ์ ๊ตฌํ๊ธฐ
df_last.groupby(["์ง์ญ๋ช "])["ํ๋น๋ถ์๊ฐ๊ฒฉ"].mean()
pd.pivot_table(df_last, index=["์ง์ญ๋ช "], values=["ํ๋น๋ถ์๊ฐ๊ฒฉ"], aggfunc="mean")
- aggfunc๋ ์๋์ผ๋ก ํ๊ท ๊ฐ ์ถ๋ ฅ
- ์ ์ฉ๋ฉด์ ์ผ๋ก ๋ถ์๊ฐ๊ฒฉ์ ํ๊ท ๊ตฌํ๊ธฐ
df_last.groupby(["์ ์ฉ๋ฉด์ "])["ํ๋น๋ถ์๊ฐ๊ฒฉ"].mean()
pd.pivot_table(df_last, index="์ ์ฉ๋ฉด์ ", values="ํ๋น๋ถ์๊ฐ๊ฒฉ")
- ์ง์ญ๋ช , ์ ์ฉ๋ฉด์ ์ผ๋ก ํ๋น๋ถ์๊ฐ๊ฒฉ์ ํ๊ท ๊ตฌํ๊ธฐ
df_last.groupby(["์ง์ญ๋ช , ์ ์ฉ๋ฉด์ "])["ํ๋น๋ถ์๊ฐ๊ฒฉ"].mean().unstack().round()
df_last.pivot_table(index="์ ์ฉ๋ฉด์ ", columns="์ง์ญ๋ช ", values="ํ๋น๋ถ์๊ฐ๊ฒฉ").round()
- unstack() : ๋ง์ง๋ง ์ธ๋ฑ์ค๊ฐ ์ปฌ๋ผ๊ฐ์ผ๋ก ์ค๊ฒ ๋จ
- round() : ์์์ ์ ๊ฑฐ
- T / transpose() : ํ๊ณผ ์ด ๊ต์ฒด
- ์ฐ๋, ์ง์ญ๋ช ์ผ๋ก ํ๋น๋ถ์๊ฐ๊ฒฉ์ ํ๊ท ๊ตฌํ๊ธฐ
g = df_last.groupby(["์ฐ๋", "์ง์ญ๋ช "])["ํ๋น๋ถ์๊ฐ๊ฒฉ"].mean()
p = pd.pivot_table(df_last, index=["์ฐ๋", "์ง์ญ๋ช "], values="ํ๋น๋ถ์๊ฐ๊ฒฉ")
p.loc(2018)
- loc() : ํ์ ๊ธฐ์ค์ผ๋ก ๊ฐ์ ธ์ฌ ๋
- loc(2018) : 2018๋ ๋ฐ์ดํฐ๋ง ๋ณด๊ณ ์ถ์ ๊ฒฝ์ฐ
- groupby ๋ณด๋จ pivot_table์ด ์กฐ๊ธ ๋ ์ง๊ด์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅ
- groupby๋ ๊ฒฐ๊ณผ๊ฐ์ด series ํํ์ด๋ฏ๋ก pivot_table๋ณด๋ค ์ฐ์ฐ์ ๊ฒฐ๊ณผ๊ฐ ๋ ๋น ๋ฅด๋ค.
'Computer ๐ป > ๋ฐ์ดํฐ ๋ถ์' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Comments