์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Kaggle
- ์๋๋ก์ด๋์คํ๋์ค
- react
- ๋ค์ดํฐ๋ธ
- nlp
- ์๊ณ ๋ฆฌ์ฆ
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- ๋ฆฌ์กํธ
- Titanic
- ์ ํ๋์ํ
- ๋์
- ์ธํ๋ฐ
- ๋ฅ๋ฌ๋
- ๋ฐฑ์ค
- ๊นํ
- ๊ฒฐ์ ํธ๋ฆฌ
- ๋ฐ์ดํฐ๋ถ์
- ๋ถ์
- ๋จธ์ ๋ฌ๋
- ๋ฐ์ดํฐ
- ํ์ดํ๋
- ๋ฐ์ดํฐ์๊ฐํ
- ์ํ์ฝ๋ฉ
- AI
- linearalgebra
- cs231n
- ์๋ฒ ๋ฉ
- Git
- c++
- native
- Today
- Total
yeon's ๐ฉ๐ป๐ป
[๋ฐ์ดํฐ ๋ถ์] ์๊ฐํ | ์๊ด๊ณ์, ์์นํ ๋ณ์ ๋ณธ๋ฌธ
[๋ฐ์ดํฐ ๋ถ์] ์๊ฐํ | ์๊ด๊ณ์, ์์นํ ๋ณ์
yeon42 2021. 7. 31. 16:499.3 ๋จ๋ณ๋ ์์นํ ๋ณ์ ์๊ฐํ
- ์๋์ distplot ๊ทธ๋ฆฌ๊ธฐ
sns.distplot(df["์๋"])
- ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ ์ ์ ์์ธ๊ณผ ๋ถ์ฐ์ ์ ๋ณด๋ง ๋ด๊ฒจ์๋ค. (์์ธ-์ค๋ฅธ์ชฝ, ๋ถ์ฐ-์ค๋ฅธ์ชฝ)
- distplot : ๋ถ๋๋ฌ์ด ๊ณก์ ์ธ ํ๋ฅ ๋ฐ๋ ํจ์๋ ํจ๊ป ๊ทธ๋ ค์ค
- ๋ง๋์ ๊ฐ์๋ bins๋ฅผ ํตํด ์กฐ์ ๊ฐ๋ฅ
- ๊ฒฝ๋์ distplot ๊ทธ๋ฆฌ๊ธฐ
sns.distplot(df["๊ฒฝ๋"])
(์์ธ-์ผ์ชฝ, ๋ถ์ฐ-์ค๋ฅธ์ชฝ)
- ์/๊ฒฝ๋์ ํ๊ท , ์ค์๊ฐ ํํํ๊ธฐ
plt.axvline(df["์๋"].mean(), linestyle=":", color="r")
plt.axvline(df["๊ฒฝ๋"].median(), linestyle="--")
sns.distplot(df["์๋"])
- ํ๊ท ์ ๋นจ๊ฐ ์ ์ , ์ค์๊ฐ์ ๋จ์ ์ค์ ์ผ๋ก ํํ๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
- color๋ก ์์ ์กฐ์ ์ด, linestyle๋ก ์ ์ ๋ชจ์ ์กฐ์ ์ด ๊ฐ๋ฅํ๋ค.
9.4 ์๊ด๊ณ์
- X, Y๊ฐ ์์ ํ ๋์ผํ๋ฉด +1, ์ ํ ๋ค๋ฅด๋ฉด 0, ๋ฐ๋๋ฐฉํฅ์ผ๋ก ์์ ํ ๋์ผํ๋ฉด -1
- ๊ฒฐ์ ๊ณ์ : r**2๋ก, X๋ก๋ถํฐ Y๋ฅผ ์์ธกํ ์ ์๋ ์ ๋
- ๊ฐ ๋ณ์์ ์๊ด๊ณ์ ๊ตฌํ๊ธฐ
corr = df.corr()
- ์๊ด๊ณ์ ์๊ฐํ
https://seaborn.pydata.org/examples/many_pairwise_correlations.html
mask = np.triu(np.ones_like(corr, dtype=np.bool))
sns.heatmap(corr, annot=True, cmap="Blues", mask=mask)
- mask = ~~ : ๋๊ฐ์ ์ ํ์๊ฒ ํ๊ณ , ๋๋จธ์ง ๊ฐ๋ค๋ง ํ์
- annot=True : corr์ ์์น ๊ฐ ๋ณด์ฌ์ฃผ๊ธฐ
- cmap="์ปฌ๋ฌ" : ์ ๋ณ๊ฒฝ
- ๊ฒฝ๋์ ์๋๋ (-0.99) ๊ฐํ ์์ ์๊ด๊ด๊ณ๊ฐ ์๊ตฌ๋ ~