์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- native
- ๊นํ
- ๋ฆฌ์กํธ
- ์ธํ๋ฐ
- Kaggle
- ๋ถ์
- ๋จธ์ ๋ฌ๋
- Git
- cs231n
- ์ ํ๋์ํ
- ๋ฅ๋ฌ๋
- AI
- ๋ค์ดํฐ๋ธ
- ์๋๋ก์ด๋์คํ๋์ค
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- ์๋ฒ ๋ฉ
- ๋ฐ์ดํฐ๋ถ์
- ๋์
- ๋ฐฑ์ค
- ๋ฐ์ดํฐ
- ํ์ดํ๋
- ์ํ์ฝ๋ฉ
- ๋ฐ์ดํฐ์๊ฐํ
- c++
- ์๊ณ ๋ฆฌ์ฆ
- nlp
- ๊ฒฐ์ ํธ๋ฆฌ
- react
- linearalgebra
- Titanic
- Today
- Total
yeon's ๐ฉ๐ป๐ป
[๋ฐ์ดํฐ ๋ถ์] ์ฐ๋๋ณ/์ง์ญ๋ณ ์๊ฐํ ๋ณธ๋ฌธ
[๋ฐ์ดํฐ ๋ถ์] ์ฐ๋๋ณ/์ง์ญ๋ณ ์๊ฐํ
yeon42 2021. 7. 26. 14:11- ์ง๊ธ๊น์ง ์ฐ๋ฆฌ๋ ์ ํ ๋ค๋ฅธ ๋ ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ํฉ์ณ df๋ผ๋ data frame์ ์ ์ฅํ์๋ค.
- ์ด data๋ฅผ ์ฐ๋๋ณ&์ง์ญ๋ณ๋ก ๊ทธ๋ ค๋ณด์ !!
* barplot
sns.barplot(data=df, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
sns.barplot(data=df, x="์ง์ญ๋ช ", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
* pointplot
sns.pointplot(data=df, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ", hue="์ง์ญ๋ช ")
- legend๋ ๋ฐ๊นฅ์ ๋นผ๋๋ก ์กฐ์
- ๊ธฐ์ธ๊ธฐ์ ๋ฐ๋ผ ๊ฐ์ ๋ณํ ์ ๋๋ฅผ ํ์ ํ๊ธฐ ์ฝ๋ค.
* ์์ธ๋ง barplot์ผ๋ก
df_seoul = df[df["์ง์ญ๋ช "] == "์์ธ"].copy()
sns.barplot(data=df_seoul, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ", color="y")
sns.pointplot(data=df_seoul, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ", color="y")
* boxplot & boxenplot
sns.boxplot(data=df, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
sns.boxenplot(data=df, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
sns.boxplot(data=df, x="์ง์ญ๋ช ", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
sns.boxenplot(data=df, x="์ง์ญ๋ช ", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
- boxenplot : boxplot์ ์ข ๋ ๊ฐ์ (boxplot + violinplot์ ์ค๊ฐ)
- boxplot์ ๋จ์ ์ ๋ณด์ํด ์์ data๊ฐ ์ผ๋ง๋ ๋ถํฌ๋์ด์๋์ง๋ฅผ distribution ๊ฐ์ ํํํจ
* violinplot
sns.violinplot(data=df, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
sns.violinplot(data=df, x="์ง์ญ๋ช ", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
- ์์ ๊ฒ์ ๋ค๋ชจ : boxplot
- ์์ ํ์์ ์ : ์ค์๊ฐ
* swarmplot
sns.swarmplot(data=df, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ", hue="์ง์ญ๋ช ")
sns.swarmplot(data=df, x="์ง์ญ๋ช ", y="ํ๋น๋ถ์๊ฐ๊ฒฉ", hue="์ฐ๋")
- data ๋ถํฌ๋ฅผ ๋ ์ ํ์ธํ ์ ์์
(+) violin & swarmplot ํฉ์น๊ธฐ
sns.violinplot(data=df, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ")
sns.swarmplot(data=df, x="์ฐ๋", y="ํ๋น๋ถ์๊ฐ๊ฒฉ", hue="์ง์ญ๋ช ")
- ๋งจ ์์ ์ด์์น ๊ฐ๋ค์ ๋ชจ๋ ๋ค ์์ธ์ ๊ฐ๋ค
'์ ๊ตญ ์ ๊ท ๋ฏผ๊ฐ ์ํํธ ๋ถ์๊ฐ๊ฒฉ' ์ด๋ฆ์ Chap 01 ๋ !!
๋ฐ์ดํฐ ๋ถ์์ด๋ผ๋ ๊ฒ์ ์ฒ์ ์ ํด๋ณด๊ณ ๋ค์ ๊ฐ์์๋๋ฐ ์๊ฐ๋ณด๋ค ์ฌ๋ฐ์๋ค.
์์ง ์ ๋๋ก ๋ถ์ํ๋ ๊ฒ๋ณด๋ค๋ ์ด๋ค ์์ผ๋ก ์ ๊ทผํด์ผํ๋์ง๋ฅผ ๋ฐฐ์ ๋ ๊ฒ ๊ฐ๋ค.
๋ค์ ์ฑํฐ๋ค๋ ์ด์ฌํ ๋ฐ๋ผ๊ฐ๋ณด์ !!!!!!!
'Computer ๐ป > ๋ฐ์ดํฐ ๋ถ์' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[kaggle] ํ์ดํ๋(titanic) | 3. EDA - Sex (์ฑ๋ณ) (0) | 2021.07.27 |
---|---|
[kaggle] ํ์ดํ๋(titanic) | 2. EDA - Pclass (0) | 2021.07.26 |
[๋ฐ์ดํฐ ๋ถ์] concat์ผ๋ก ํฉ์น๊ธฐ, heatmap (0) | 2021.07.26 |
[kaggle] ํ์ดํ๋(titanic) | 1. Dataset Check (0) | 2021.07.26 |
[๋ฐ์ดํฐ ๋ถ์] ๋ถ๋ฆฌํ๊ธฐ (์ฐ/์) (0) | 2021.07.24 |