์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- ๋ฐ์ดํฐ๋ถ์
- ์ธํ๋ฐ
- ๋ฐ์ดํฐ์๊ฐํ
- ์๊ณ ๋ฆฌ์ฆ
- ๋ค์ดํฐ๋ธ
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- ์ํ์ฝ๋ฉ
- Titanic
- ์๋ฒ ๋ฉ
- ์๋๋ก์ด๋์คํ๋์ค
- ๋์
- ๊ฒฐ์ ํธ๋ฆฌ
- linearalgebra
- ๋จธ์ ๋ฌ๋
- ๊นํ
- ํ์ดํ๋
- c++
- ๋ฐฑ์ค
- cs231n
- native
- nlp
- Git
- ๋ฅ๋ฌ๋
- AI
- ๋ฐ์ดํฐ
- ์ ํ๋์ํ
- react
- ๋ถ์
- Kaggle
- ๋ฆฌ์กํธ
- Today
- Total
yeon's ๐ฉ๐ป๐ป
๊ณผ๋์ ํฉ(Overfitting) vs. ๊ณผ์์ ํฉ(Underfitting) ๋ณธ๋ฌธ
๊ณผ๋์ ํฉ(Overfitting) vs. ๊ณผ์์ ํฉ(Underfitting)
yeon42 2021. 8. 25. 21:19https://m.blog.naver.com/qbxlvnf11/221324122821
๋จธ์ ๋ฌ๋ - ๊ณผ๋์ ํฉ(overfitting)๊ณผ ๊ณผ์์ ํฉ(underfitting), ์ ๊ทํ
(๋ณธ ๊ธ์ ์ฑ 'Hands-On Machine Learning with Scikit-Learn & TensorFlow'์ ์ผ๋ถ๋ฅผ ์ฐธ๊ณ ํ์...
blog.naver.com
์ ๋ธ๋ก๊ทธ๋ฅผ ํ์ฌํ๋ฉฐ ๊ณต๋ถํ ๊ฒ
* ๊ณผ๋์ ํฉ (overfitting)
: ๋ชจ๋ธ์ด ํ๋ จ ๋ฐ์ดํฐ์ ๋๋ฌด ์ ๋ง์ง๋ง ์ผ๋ฐ์ฑ์ด ๋จ์ด์ง๋ค.
- ์์ ๊ทธ๋ฆผ์์ ํ๋ ์ ์ ๋ชจ๋ธ(ํจ์)์ด ์ค๋ฒํผํ ํ ์
- ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ ํํ ๋ค ๊ฑฐ์น๋ฉฐ ํ๋ จ ๋ฐ์ดํฐ์ ๋ํด ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค.
- but, ์ด ๋ชจ๋ธ์ ํ ์คํธ ๋ฐ์ดํฐ์ ๋ํด์๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค ํ๋ฅ ์ด ๋ฎ๋ค.
- because, ํ๋ จ ๋ฐ์ดํฐ์ ๋๋ฌด ๋ง์ถฐ์๊ธฐ ๋๋ฌธ์ ์ด ์ธ์ ๋ค์ํ ๋ณ์์๋ ๋์ํ๊ธฐ ํ๋ฌ
-> ๋ชจ๋ธ์ ๋ณต์ก๋๊ฐ ํ์ ์ด์์ผ๋ก ๋๊ธฐ ๋๋ฌธ
- ๊ณผ๋์ ํฉ(overfitting) ํด๊ฒฐ๋ฒ
1. ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๋ ๋ง์ด ๋ชจ์ผ๊ธฐ
2. ์ ๊ทํ(Regularization) : ๊ท์ , ๋๋กญ-์์ ๋ฑ์ ๋ฐฉ๋ฒ์ ํตํด ์ ๋นํ ๋ณต์ก๋ ๊ฐ์ง๋ ๋ชจ๋ธ์ ์๋์ ์ผ๋ก ์ฐพ์์ฃผ๋ ๋ฐฉ๋ฒ
3. ํ๋ จ ๋ฐ์ดํฐ์ ์ก์ ์ค์ด๊ธฐ : ์ค๋ฅ ์์ , ์ด์์น ์ ๊ฑฐ
- ์์ ๊ฐ์ ๊ณผ๋์ ํฉ ๋ชจ๋ธ์ ๋ชจ๋ธ์ ๊ฐ๋จํ๊ฒ ํด์ฃผ๋ฉฐ ํด๊ฒฐํด์ผ ํ๋ค. = ๋ชจ๋ธ์ ๋ณต์ก๋ ๋ฎ์ถ๊ธฐ
- ๊ฐ๋จํ๊ฒ 2~3์ฐจ ํจ์์ ํํ๋ก ๋ง๋ค์.
--> ์ ๋ณด๋ค ํ๋ จ ๋ฐ์ดํฐ์๋ ์ฑ๋ฅ์ด ์ ๋์ค์ง ์์ง๋ง, ํ์ ์ด์์ผ๋ก ๋ณต์กํ ํจํด์ ํ์ตํ์ง ์์ผ๋ฉฐ, ํ ์คํธ ๋ฐ์ดํฐ์ ์ ๋์ฒ ํ ์ ์์
* ํ์ดํผํ๋ผ๋ฏธํฐ(hyperparameter)
- ๊ท์ : ๋ชจ๋ธ์ ๋จ์ํ๊ฒ ํ๊ณ ๊ณผ๋์ ํฉ์ ์ํ์ ๊ฐ์์ํค๊ธฐ ์ํด ๋ชจ๋ธ์ ์ ์ฝ์ ๊ฐํ๋ ๊ฒ
- ํ์ตํ๋ ๋์ ์ ์ฉํ ๊ท์ ์ ์์ ํ์ดํผํ๋ผ๋ฏธํฐ๊ฐ ๊ฒฐ์ ํจ
- ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์ํฅ ๋ฐ์งx
- ํ๋ จ ์ ์ ๋ฏธ๋ฆฌ ์ง์ ๋์ด ํ๋ จํ๋ ๋์์๋ ์์๋ก ๋จ์์์
- ํฐ ๊ฐ์ผ๋ก ์ง์ ํ ์๋ก ๋ ํํํ๊ณ ๋ณต์ก๋ ๋ฎ์ ๋ชจ๋ธ ์ป์
- ๋๋ฌด ๋์ด๋ฉด ๊ณผ์์ ํฉ ๋ฌธ์ ๋ฐ์ํ๋ฏ๋ก ์ ์ ํ๊ฒ ์ค์ ํ์!
* ๊ณผ์์ ํฉ (Underfitting)
: ๋ชจ๋ธ์ด ๋๋ฌด ๋จ์ํด ๋ฐ์ดํฐ์ ๋ด์ฌ๋ ๊ตฌ์กฐ๋ฅผ ํ์ตํ์ง ๋ชปํ ๋ ๋ฐ์
- ๊ณผ๋์ ํฉ์ ๋ฐ๋
- ๊ณผ์์ ํฉ(underfitting)์ ํด๊ฒฐ ๋ฐฉ๋ฒ
1. ํ๋ผ๋ฏธํฐ๊ฐ ๋ ๋ง์ ๋ณต์กํ ๋ชจ๋ธ ์ ํ
2. ๋ชจ๋ธ์ ์ ์ฝ ์ค์ด๊ธฐ : ๊ท์ ํ์ดํผํ๋ผ๋ฏธํฐ ๊ฐ ์ค์ด๊ธฐ
3. ์กฐ๊ธฐ ์ข ๋ฃ ์์ (overfitting์ด ๋๊ธฐ ์ ์ ์์ )๊น์ง ์ถฉ๋ถํ ํ์ต
* ์ผ๋ฐํ์ ๊ณผ๋์ ํฉ, ๊ณผ์์ ํฉ
- ๊ตณ์ด ๋ฐ๋ผ์ง์๋ฉด ๊ณผ์์ ํฉ๋ณด๋จ ๊ณผ๋์ ํฉ์ธ ์ํ๊ฐ ๋ ๋์ ์ ์๋ค.
- ๊ณผ๋์ ํฉ์ ์ต์ํ ํ๋ จ ๋ฐ์ดํฐ์์๋ผ๋ ์ฑ๋ฅ์ด ์ ๋์ค๊ธฐ ๋๋ฌธ
- ์ผ๋ฐํ(generalization)๋ ํ ์คํธ ๋ฐ์ดํฐ์ ๋ํ ๋์ ์ฑ๋ฅ์ ๊ฐ์ถ๋ ๊ฒ
- ์ฆ, ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅํ์ ๋, output์ ์ ํ๋๊ฐ ๋์ ๊ฒ
'Computer ๐ป > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์์๋ธ(ensemble) - Random Forest / Gradient Boosting (0) | 2021.08.26 |
---|---|
์ ํ ํ๊ท / ๋ฆฟ์ง ํ๊ท / ๋ผ์ ํ๊ท (0) | 2021.08.25 |
๋ฆฟ์ง(Ridge)์ ๋ผ์(Lasso) ํ๊ท (0) | 2021.08.25 |
๋๋ค ํฌ๋ ์คํธ(Random Forest) ํ๊ท ์์ (0) | 2021.08.25 |
๋๋ค ํฌ๋ ์คํธ(Random Forest) (0) | 2021.08.25 |