์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- ๋ค์ดํฐ๋ธ
- ์๋ฒ ๋ฉ
- native
- ํ์ดํ๋
- ๋ฐ์ดํฐ์๊ฐํ
- ๋ฐฑ์ค
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- ๋ฆฌ์กํธ
- ์ธํ๋ฐ
- ๋ฐ์ดํฐ
- AI
- ๋ฐ์ดํฐ๋ถ์
- c++
- ์ ํ๋์ํ
- cs231n
- Git
- linearalgebra
- ๋จธ์ ๋ฌ๋
- Titanic
- ๋์
- ์๋๋ก์ด๋์คํ๋์ค
- react
- nlp
- ๊นํ
- ๊ฒฐ์ ํธ๋ฆฌ
- Kaggle
- ๋ถ์
- ๋ฅ๋ฌ๋
- ์ํ์ฝ๋ฉ
- ์๊ณ ๋ฆฌ์ฆ
- Today
- Total
yeon's ๐ฉ๐ป๐ป
์์๋ธ ๋ชจ๋ธ ๋ณธ๋ฌธ
๋จธ์ ๋ฌ๋ - 11. ์์๋ธ ํ์ต (Ensemble Learning): ๋ฐฐ๊น (Bagging)๊ณผ ๋ถ์คํ (Boosting)
์์๋ธ(Ensemble) ์์๋ธ์ ์กฐํ ๋๋ ํต์ผ์ ์๋ฏธํฉ๋๋ค. ์ด๋ค ๋ฐ์ดํฐ์ ๊ฐ์ ์์ธกํ๋ค๊ณ ํ ๋, ํ๋์ ๋ชจ๋ธ์ ํ์ฉํฉ๋๋ค. ํ์ง๋ง ์ฌ๋ฌ ๊ฐ์ ๋ชจ๋ธ์ ์กฐํ๋กญ๊ฒ ํ์ต์์ผ ๊ทธ ๋ชจ๋ธ๋ค์ ์์ธก ๊ฒฐ๊ณผ๋ค
bkshin.tistory.com
์ ๋ธ๋ก๊ทธ๋ฅผ ํ์ฌํ๋ฉฐ ๊ณต๋ถ
* ๋ชจ๋ ํ ์คํธ์ ์ด๋ฏธ์ง์ ์ถ์ฒ๋ ์ ๋ธ๋ก๊ทธ์ ๋๋ค.
์์๋ธ (Ensemble)
- ์ด๋ค ๋ฐ์ดํฐ ๊ฐ์ ์์ธกํ ๋, ์ฌ๋ฌ ๊ฐ์ ๋ชจ๋ธ์ ์กฐํ๋กญ๊ฒ ํ์ต์์ผ ๊ทธ ๋ชจ๋ธ๋ค์ ์์ธก ๊ฒฐ๊ณผ๋ค์ ์ด์ฉํ๋ค๋ฉด
๋ ์ ํํ ์์ธก๊ฐ์ ๊ตฌํ ์ ์์ ๊ฒ์ด๋ค.
- ์์๋ธ ํ์ต์ ์ฌ๋ฌ ๊ฐ์ ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)๋ฅผ ๊ฒฐํฉ์์ผ ํ๋์ ๊ฒฐ์ ํธ๋ฆฌ๋ณด๋ค ๋ ์ข์ ์ฑ๋ฅ์ ๋ด๋ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ
- ์ฌ๋ฌ ๊ฐ์ ์ฝ ๋ถ๋ฅ๊ธฐ(Weak Classifier)๋ฅผ ๊ฒฐํฉ์์ผ ๊ฐ ๋ถ๋ฅ๊ธฐ(Strong Classifier)๋ฅผ ๋ง๋๋ ๊ฒ
--> ๋ชจ๋ธ์ ์ ํ๋ ํฅ์
* ์์๋ธ ํ์ต์ 2๊ฐ์ง ์ข ๋ฅ
- ๋ฐฐ๊น (Bagging) & ๋ถ์คํ (Boosting)
1. ๋ฐฐ๊น (Bagging)
- ๋ฐฐ๊น (Bagging)์ Bootstrap Aggregation์ ์ฝ์
: ์ํ์ ์ฌ๋ฌ ๋ฒ ๋ฝ์(Bootstrap) ๊ฐ ๋ชจ๋ธ์ ํ์ต์์ผ ๊ฒฐ๊ณผ๋ฌผ์ ์ง๊ณ(Aggregation)ํ๋ ๋ฐฉ๋ฒ
- ์ฐ์ ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ถํธ์คํธ๋ฉ์ ํจ
- (๋ณต์ ๋๋ค ์ํ๋ง) ๋ถํธ์คํธ๋ฉํ ๋ฐ์ดํฐ๋ก ๋ชจ๋ธ์ ํ์ต์ํด
- ํ์ต๋ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ ์ง๊ณํ์ฌ ์ต์ข ๊ฒฐ๊ณผ ๊ฐ์ ๊ตฌํจ
- Categorical Data๋ ํฌํ ๋ฐฉ์(Voting)์ผ๋ก ๊ฒฐ๊ณผ๋ฅผ ์ง๊ณํ๋ฉฐ, Continuous Data๋ ํ๊ท ์ผ๋ก ์ง๊ณํจ
- Categorical Data์ผ ๋, Voting์ ์ ์ฒด ๋ชจ๋ธ์์ ์์ธกํ ๊ฐ ์ค ๊ฐ์ฅ ๋ง์ ๊ฐ์ ์ต์ข ์์ธก๊ฐ์ผ๋ก ์ ์ ํ๋ค๋ ๊ฒ
ex. 6๊ฐ์ ๊ฒฐ์ ํธ๋ฆฌ ๋ชจ๋ธ์ด ์๋ค๊ณ ํ์.
- 4๊ฐ๋ A๋ก ์์ธก, 2๊ฐ๋ B๋ก ์์ธกํจ -> ํฌํ์ ์ํด 4๊ฐ์ ๋ชจ๋ธ์ด ์ ํํ A๋ฅผ ์ต์ข ๊ฒฐ๊ณผ๋ก ์์ธก
- ํ๊ท ์ผ๋ก ์ง๊ณํ๋ค๋ ๊ฒ์ ๋ง ๊ทธ๋๋ก ๊ฐ ๊ฒฐ์ ํธ๋ฆฌ ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ์ ํ๊ท ์ ์ทจํด ์ต์ข Bagging Model์ ์์ธก๊ฐ์ ๊ฒฐ์ ํ๋ค๋ ๋ป
- ๋ฐฐ๊น ์ ํ์ฉํ ๋ชจ๋ธ์ด ๋ฐ๋ก ๋๋ค ํฌ๋ ์คํธ
2. ๋ถ์คํ (Boosting)
- ๋ถ์คํ ์ ๊ฐ์ค์น๋ฅผ ํ์ฉํด ์ฝ ๋ถ๋ฅ๊ธฐ๋ฅผ ๊ฐ ๋ถ๋ฅ๊ธฐ๋ก ๋ง๋๋ ๋ฐฉ๋ฒ
- ๋ฐฐ๊น ์ Decision Tree1๊ณผ Decision Tree2๊ฐ ์๋ก ๋ ๋ฆฝ์ ์ผ๋ก ๊ฒฐ๊ณผ๋ฅผ ์์ธกํจ
- ์ฌ๋ฌ ๊ฐ์ ๋ ๋ฆฝ์ ์ธ ๊ฒฐ์ ํธ๋ฆฌ๊ฐ ๊ฐ๊ฐ ๊ฐ์ ์์ธกํ ๋ค, ๊ทธ ๊ฒฐ๊ณผ ๊ฐ์ ์ง๊ณํด ์ต์ข ๊ฒฐ๊ณผ ๊ฐ์ ์์ธกํ๋ ๋ฐฉ์
- ํ์ง๋ง ๋ถ์คํ ์ ๋ชจ๋ธ ๊ฐ์ ํ์ํฌ๊ฐ ์ด๋ฃจ์ด์ง
- ์ฒ์ ๋ชจ๋ธ์ด ์์ธก์ ํ๋ฉด ๊ทธ ์์ธก ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ๋ฐ์ดํฐ์ ๊ฐ์ค์น๊ฐ ๋ถ์ฌ๋๊ณ , ๋ถ์ฌ๋ ๊ฐ์ค์น๊ฐ ๋ค์ ๋ชจ๋ธ์ ์ํฅ์ ์ค
- ์๋ชป ๋ถ๋ฅ๋ ๋ฐ์ดํฐ์ ์ง์คํด ์๋ก์ด ๋ถ๋ฅ ๊ท์น์ ๋ง๋๋ ๋จ๊ณ๋ฅผ ๋ฐ๋ณต
* ์์ : +์ -๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ์ ์ ๋ถ๋ฅํ๋ ๋ฌธ์
- D1์์๋ 2/5 ์ง์ ์ ํก๋จํ๋ ๊ตฌ๋ถ์ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋๋์ด์ฃผ์๋ค.
- ํ์ง๋ง ์์ชฝ์ +์ ์๋์ชฝ์ ๋ ๊ฐ์ -๋ ์๋ชป ๋ถ๋ฅ๋จ
--> ์๋ชป ๋ถ๋ฅ๊ฐ ๋ ๋ฐ์ดํฐ๋ ๊ฐ์ค์น๋ฅผ ๋์ฌ์ฃผ๊ณ , ์ ๋ถ๋ฅ๋ ๋ฐ์ดํฐ๋ ๊ฐ์ค์น๋ฅผ ๋ฎ์ถ์ด ์ค
- D2๋ฅผ ๋ณด๋ฉด D1์์ ์ ๋ถ๋ฅ๋ ๋ฐ์ดํฐ๋ ํฌ๊ธฐ๊ฐ ์์์ก๊ณ (=๊ฐ์ค์น๊ฐ ๋ฎ์์ก๊ณ ), ์๋ชป ๋ถ๋ฅ๋ ๋ฐ์ดํฐ๋ ํฌ๊ธฐ๊ฐ ์ปค์ง(=๊ฐ์ค์น๊ฐ ์ปค์ง)
- ๋ถ๋ฅ๊ฐ ์๋ชป๋ ๋ฐ์ดํฐ์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ ์ด์ ๋ ๋ค์ ๋ชจ๋ธ์์ ๋ ์ง์คํด ๋ถ๋ฅํ๊ธฐ ์ํจ์ด๋ค.
- D2์์๋ ์ค๋ฅธ์ชฝ ์ธ ๊ฐ์ -๊ฐ ์๋ชป ๋ถ๋ฅ๋์๋ค.
- ๋ฐ๋ผ์ D3์์ ์ธ ๊ฐ์ -๊ฐ ๊ฐ์ค์น๊ฐ ์ปค์ก๋ค.
- ๋งจ ์ฒ์ ๋ชจ๋ธ์์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ +์ -๋ D2์์๋ ์ ๋ถ๋ฅ๋์๊ธฐ ๋๋ฌธ์ ๊ฐ์ค์น๊ฐ ๋ค์ ์์์ก๋ค.
- D1, D2, D3์ classifier๋ฅผ ํฉ์ณ ์ต์ข classifier๋ฅผ ๊ตฌํ ์ ์๋ค.
- ์ต์ข classifier๋ +์ -๋ฅผ ์ ํํ๊ฒ ๊ตฌ๋ถํด์ค๋ค.
๋ฐฐ๊น ๊ณผ ๋ถ์คํ ์ฐจ์ด
- ๋ฐฐ๊น ์ ๋ณ๋ ฌ๋ก ํ์ตํ๋ ๋ฐ๋ฉด, ๋ถ์คํ ์ ์์ฐจ์ ์ผ๋ก ํ์ตํ๋ค.
- ํ ๋ฒ ํ์ต์ด ๋๋ ํ ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํจ
- ๊ทธ๋ ๊ฒ ๋ถ์ฌ๋ ๊ฐ์ค์น๊ฐ ๋ค์ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ ์์ธก์ ์ํฅ์ ์ค๋ค.
- ์ค๋ต์ ๋ํด์๋ ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌ, ์ ๋ต์ ๋ํด์๋ ๋ฎ์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌ
- ๋ฐ๋ผ์ ์ค๋ต์ ์ ๋ต์ผ๋ก ๋ง์ถ๊ธฐ ์ํด ์ค๋ต์ ๋ ์ง์ค ๊ฐ๋ฅํ๋ค.
- ๋ถ์คํ ์ ๋ฐฐ๊น ์ ๋นํด error๊ฐ ์ ์ (์ฑ๋ฅ์ด ์ข๋ค.)
- ํ์ง๋ง ์๋๊ฐ ๋๋ฆฌ๊ณ , overfitting๋ ๊ฐ๋ฅ์ฑ์ด ์๋ค.
- ๊ฐ๋ณ ๊ฒฐ์ ํธ๋ฆฌ์ ๋ฎ์ ์ฑ๋ฅ์ด ๋ฌธ์ ๋ผ๋ฉด --> ๋ถ์คํ
- ์ค๋ฒํผํ ์ด ๋ฌธ์ ๋ผ๋ฉด --> ๋ฐฐ๊น
'Computer ๐ป > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋ฒ ์ด์ฆ ์ถ์ (Bayesian Estimation) (0) | 2021.11.05 |
---|---|
์์ ๋ค์ ๊ธฐ๋ ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree) ๋ค์ ์ ๋ฆฌํ๊ธฐ ํธํธ (0) | 2021.11.03 |
๋ถํธ์คํธ๋ฉ(Bootstrap) (0) | 2021.11.03 |
์ฒจ๋(Kurtosis)์ ์๋(Skewness) (0) | 2021.09.10 |
๋๋ค ํฌ๋ ์คํธ(Random Forest) (0) | 2021.08.31 |