์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- ๋ฐ์ดํฐ๋ถ์
- native
- ๋ฐ์ดํฐ์๊ฐํ
- ๋ฆฌ์กํธ
- ๋ถ์
- ์๋๋ก์ด๋์คํ๋์ค
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- nlp
- react
- Titanic
- ํ์ดํ๋
- ๊นํ
- ์๊ณ ๋ฆฌ์ฆ
- ๋ฐฑ์ค
- cs231n
- ์ํ์ฝ๋ฉ
- c++
- ๋์
- ์๋ฒ ๋ฉ
- ์ธํ๋ฐ
- ๋ค์ดํฐ๋ธ
- linearalgebra
- Git
- ์ ํ๋์ํ
- ๋จธ์ ๋ฌ๋
- ๋ฅ๋ฌ๋
- ๋ฐ์ดํฐ
- AI
- ๊ฒฐ์ ํธ๋ฆฌ
- Kaggle
- Today
- Total
yeon's ๐ฉ๐ป๐ป
๋ฆฟ์ง(Ridge)์ ๋ผ์(Lasso) ํ๊ท ๋ณธ๋ฌธ
https://rk1993.tistory.com/entry/Ridge-regression์-Lasso-regression-์ฝ๊ฒ-์ดํดํ๊ธฐ
Ridge regression(๋ฆฟ์ง ํ๊ท)์ Lasso regression(๋ผ์ ํ๊ท) ์ฝ๊ฒ ์ดํดํ๊ธฐ
Ridge regression์ Lasso regression๋ฅผ ์ดํดํ๋ ค๋ฉด ์ผ๋จ ์ ๊ทํ(regularization)๋ฅผ ์์์ผํฉ๋๋ค. ์ฒซ๋ฒ์งธ ๊ทธ๋ฆผ์ ๋ณด๋ฉด ์ง์ ๋ฐฉ์ ์์ ์ด์ฉํ์ฌ ์ ์ ๊ทธ์์ต๋๋ค. ๋ฐ์ดํฐ์ ์ง์ ์ ์ฐจ์ด๊ฐ ๊ฝค ๋๋ค์. ์ ํํ
rk1993.tistory.com
๋ฅผ ๋ฐ๋ผ ํ์ฌํ๋ฉฐ ๊ณต๋ถ
* ๋ชจ๋ ์ด๋ฏธ์ง๋ ์ ๋ธ๋ก๊ทธ์์ ์ฐธ์กฐํ์์ต๋๋ค. *
* ์ ๊ทํ (Regularization)
- ์ฒซ ๋ฒ์งธ ๊ทธ๋ฆผ: ๋ฐ์ดํฐ์ ์ง์ ์ ์ฐจ์ด๊ฐ ๊ฝค ๋๋ค.
- ์ ํํ ์์ธกx
- underfitted / high bias
- bias๊ฐ ํฐ ๋ชจ๋ธ์ test data๋ฅผ ์ํ ํ์ต์ด ๋ ๋ ๊ฒ์ด ์์ธ
- ์ด๋ train data์ test data๊ฐ์ ์ฐจ์ด๊ฐ ๋๋ฌด ์ปค train data๋ก๋ง ํ์ตํ ๋ชจ๋ธ์ test data๋ฅผ ๋ง์ถ๊ธฐ๊ฐ ์ด๋ ค์
- ์ธ ๋ฒ์งธ ๊ทธ๋ฆผ: ํ์ฌ ๋ฐ์ดํฐ๋ก๋ ์ ๋ง์ง๋ง, ๋ค๋ฅธ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ ์ ํํ ์์ธก x
- overfitting / high variance
- variance๊ฐ ํฐ ๋ชจ๋ธ์ train data์ overfitting๋ ๊ฒ์ด ์์ธ
- ์ด๋ train data์ ๋๋ฌด fitting๋ ๋ชจ๋ธ์ ๋ง๋ค์ด test data์์ ์ค์ฐจ๊ฐ ๋ฐ์ํจ
- ๋ ๋ฒ์งธ ๊ทธ๋ฆผ : ์ด๋ ์ ๋ ๋ฐ์ดํฐ์ ์ ํฉํ๋ฉฐ bias์ variance์ ๋ํด์๋ ์ ์ ํจ
- ๋ชจ๋ธ์ ๋ง๋ค ๋ bias์ variance๋ฅผ ๋ ๋ค ์ค์ฌ์ฃผ๋ฉด ์ ์ผ ์ข๊ฒ ์ง๋ง, ํ๋๋ฅผ ํฌ๊ธฐํ๊ธฐ๋ ํด์ผ ํ๋ค.
-> bias๋ฅผ ์กฐ๊ธ ๊ฐ์ง๋๋ผ๋ ์ ์ผ ์์ variance๋ฅผ ๊ฐ์ง๋ ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ์ด ์ข์ง ์์๊น?
-> overfitting์ ํด๊ฒฐํจ์ผ๋ก์จ ํจ๊ณผ๋ฅผ ๋ณผ ์ ์์ง ์์๊น?
* overfitting์ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ
1. ํน์ฑ(feature)์ ๊ฐ์ ์ค์ด๊ธฐ
- ์ฃผ์ ํน์ง์ ์ง์ ์ ํํ๊ณ ๋๋จธ์ง๋ ๋ฒ๋ฆฌ๊ธฐ
- model selection algorithm(?)์ ์ฌ์ฉํ๊ธฐ
2. ์ ๊ทํ(regularization)์ ์ํํ๊ธฐ
- ๋ชจ๋ ํน์ฑ์ ์ฌ์ฉํ๋, ํ๋ผ๋ฏธํฐ(์ธํ)์ ๊ฐ์ ์ค์ด๊ธฐ (?)
* ์ ๊ทํ(Regularization)
- ์ฒซ ๋ฒ์งธ ๊ทธ๋ํ : overfitting๋์ด ๋ชจ๋ธ์ ์ ํฉํ์ง ๋ชปํจ
- ๋ ๋ฒ์งธ ๊ทธ๋ํ์ ๊ฐ์ ๋ชจ๋ธ ์ฌ์ฉํด์ผ ํจ
- ์ ์ฒด์์ด ์ต์ํ๊ฐ ๋๋ ค๋ฉด B3๊ณผ B4๊ฐ 0์ผ๋ก ๋ ๋ ๊ฐ์ฅ ์์์์ด ๋๋ค. : ์ ๊ทํ ์ปจ์
- ๋ฒ ํ๊ฐ(ํ๋ผ๋ฏธํฐ๊ฐ)์ ์ ์ฝ์ ์ค์ผ๋ก์จ ๋ชจ๋ธ์ ์ ๋ ํด์คฌ๋ค.
- ๊ณผ์ ํฉ์ด ์๋ ์ผ๋ฐ์ฑ์ ๋๊ฒ ํด์ฃผ๋ ๊ฒ
- ํ์ฌ ๋ฐ์ดํฐ์ ๋ํ ์์ธก๋ ฅ๋ ์ค์ํ์ง๋ง ๋ฏธ๋์ ์์ธกํ ๋ฐ์ดํฐ๋ ์ค์ํ๊ธฐ ๋๋ฌธ์ ์ผ๋ฐํ๋ ์ค์ํ๋ค.
- (1) ๋ง ์์ผ๋ฉด ์ต์์ ๊ณฑ๋ฒ๊ณผ ๋ค๋ฅธ๊ฒ ์๋๋ฐ,
- (2) ๊ฐ ์ถ๊ฐ๋๋ฉด์ ๋ฒ ํ์ ์ ์ฝ์ ์ค ์ ์์ด ์ ๊ทํ๊ฐ ๊ฐ๋ฅํด์ง๋ค.
- ์ด๋ ๊ฒ ๊ณ์ ์ถ์ ์น๋ฅผ ์ค์ฌ์ฃผ๋ ์ ๊ทํ ๋ฐฉ๋ฒ์ shrinkage method๋ผ๊ณ ๋งํ๋ค.
- ๊ทธ๋ฆฌ๊ณ ์ด๋ฐ ์ ๊ทํ(regularization) ์ปจ์ ์ ์ฒ์ ๋์ ํ ๋ชจ๋ธ์ด ridge regression์ด๋ค.
* Ridge Regression (๋ฆฟ์ง ํ๊ท, L2 Regression)
- ๋ฆฟ์ง ํ๊ท์์ 'RSS(residual sum of squares) + ํจ๋ํฐ ํญ(๋ฒ ํ ๊ฐ)์ ํฉ' ์ผ๋ก ์ด๋ฃจ์ด์ ธ์๋ค.
- ๋ฆฟ์ง ํ๊ท์ ํจ๋ํฐ ํญ์ ํ๋ผ๋ฏธํฐ์ ์ ๊ณฑ์ ๋ํด์ค ๊ฒ
- ์ด๊ฒ์ ๋ฏธ๋ถ๊ฐ๋ฅํด Gradient Descent ์ต์ ํ๊ฐ ๊ฐ๋ฅํ๊ณ , ํ๋ผ๋ฏธํฐ์ ํฌ๊ธฐ๊ฐ ์์ ๊ฒ๋ณด๋ค ํฐ ๊ฒ์ ๋ ๋น ๋ฅธ ์๋๋ก ์ค์ฌ์ค๋ค.
- ์ฆ, λ(๋๋ค)๊ฐ ํด์๋ก ๋ฆฟ์ง ํ๊ท์ ๊ณ์ ์ถ์ ์น๋ 0์ ๊ฐ๊น์์ง๋ ๊ฒ์ด๋ค.
- ์ฆ, λ(๋๋ค)๊ฐ ํจ๋ํฐ๋ฅผ ์ผ๋ง๋ ๋ถ๊ณผํ๋๊ฐ๋ฅผ ์กฐ์ ํ๋ ์กฐ์ ๋ฒํผ์ด๋ค.
- ๋ฆฟ์ง ํ๊ท๋ β0^2+β1^2 ์ ์ ์ฝ์กฐ๊ฑด์ธ ์์ด ์๋ค.
- ๊ธฐ์กด์ OLS (Ordinary Least Squares)๊ฐ ์์ ๋ณด์ด๋ ์ ์ฝ์กฐ๊ฑด๊น์ง ์์ผ ์ต์ ๊ฐ์ด๋ผ๊ณ ํ ์ ์๋ค.
- ๊ทธ๋ ๋ค๋ฉด OLS๊ฐ ์ ์ฝ์กฐ๊ฑด๊ฐ์ง ์ค๊ธฐ ์ํด์๋ RSS์ ํฌ๊ธฐ๋ฅผ ํค์์ฃผ๋ฉด ๋๋ค.
- bias๊ฐ ์ฝ๊ฐ ํฌ์์ ํ์ง๋ง variance๋ฅผ ์ค์ด๊ธฐ ์ํด์ ์๋์ ๊ทธ๋ฆผ์ฒ๋ผ ์ ์ฝ์กฐ๊ฑด๊น์ง ์ค๋ ๊ฐ์ฅ ์์ RSS๋ฅผ ๊ณ ๋ฅด๋ฉด ๋๋ค. (?)
* Lasso Regression (๋ผ์ ํ๊ท, L1 Regression)
- ๋ผ์ ํ๊ท๋ ๋ฆฟ์ง ํ๊ท์ ๋น์ทํ๊ฒ ์๊ฒผ์ง๋ง ํจ๋ํฐ ํญ์ ์ ๋๊ฐ์ ํฉ์ ์ทจํด์ฃผ์๋ค.
- ๋ผ์๋ ์ ์ฝ์กฐ๊ฑด์ด ์ ๋๊ฐ์ด๋ผ ์๋์ ๊ทธ๋ฆผ์ฒ๋ผ ๋ง๋ฆ๋ชจ๊ผด์ ํํ๋ก ๋ํ๋๋ค.
- ๋ฆฟ์ง ํ๊ท์ ๋น์ทํ๊ฒ OLS์ RSS ๊ฐ์ ํฌ๊ฒ ๋๋ ค์ค๋ค.
- ๋ผ์ ํ๊ท์ ๊ฒฝ์ฐ ์ต์ ๊ฐ์ ๋ชจ์๋ฆฌ ๋ถ๋ถ์์ ๋ํ๋ ํ๋ฅ ์ด ๋ฆฟ์ง์ ๋นํด ๋์ ๋ช๋ช ์ ์๋ฏธํ์ง ์์ ๋ณ์๋ค์ ๋ํด ๊ณ์๋ฅผ 0์ ๊ฐ๊น๊ฒ ์ถ์ ํด์ฃผ์ด ๋ณ์ ์ ํ ํจ๊ณผ๋ฅผ ๊ฐ์ ธ์ค๊ฒ ๋๋ค.
- ๋ผ์ ํ๊ท๋ ํ๋ผ๋ฏธํฐ์ ํฌ๊ธฐ์ ๊ด๊ณ์์ด ๊ฐ์ ์์ค์ Regularization์ ์ ์ฉํ์๊ธฐ ๋๋ฌธ์ ์์ ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ 0์ผ๋ก ๋ง๋ค์ด ํด๋น ๋ณ์๋ฅผ ๋ชจ๋ธ์์ ์ญ์ ํ๊ณ , ๋ฐ๋ผ์ ๋ชจ๋ธ์ ๋จ์ํ๊ฒ ๋ง๋ค์ด์ฃผ๊ณ ํด์์ ์ฉ์ดํ๊ฒ ๋ง๋ค์ด์ค๋ค. (?)
- ๋ฐ๋ฉด ๋ฆฟ์ง์ ๊ฒฝ์ฐ ์ด๋ ์ ๋ ์๊ด์ฑ์ ๊ฐ์ง๋ ๋ณ์๋ค์ ๋ํด pulling ์ด ๋๋ ํจ๊ณผ๋ฅผ ๋ณด์ฌ์ค ๋ณ์ ์ ํ๋ณด๋ค๋ ์๊ด์ฑ์ด ์๋ ๋ณ์๋ค์ ๋ํด ์ ์ ํ ๊ฐ์ค์น ๋ฐฐ๋ถ์ ํ๊ฒ ๋๋ค.
- ๋ฐ๋ผ์ ๋ฆฟ์ง์ ๊ฒฝ์ฐ PCA์ ์๋นํ ๊ด๋ จ์ฑ์ด ์๊ฒ ๋๋ค.
'Computer ๐ป > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ ํ ํ๊ท / ๋ฆฟ์ง ํ๊ท / ๋ผ์ ํ๊ท (0) | 2021.08.25 |
---|---|
๊ณผ๋์ ํฉ(Overfitting) vs. ๊ณผ์์ ํฉ(Underfitting) (0) | 2021.08.25 |
๋๋ค ํฌ๋ ์คํธ(Random Forest) ํ๊ท ์์ (0) | 2021.08.25 |
๋๋ค ํฌ๋ ์คํธ(Random Forest) (0) | 2021.08.25 |
์์ฌ๊ฒฐ์ ๋๋ฌด(Decision Tree) (0) | 2021.08.25 |