์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- AI
- linearalgebra
- native
- ๊ฒฐ์ ํธ๋ฆฌ
- ๋์
- ๋ค์ดํฐ๋ธ
- ๋ฐฑ์ค
- ๋ฐ์ดํฐ
- cs231n
- ๋ฆฌ์กํธ
- Titanic
- ์ํ์ฝ๋ฉ
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- ๊นํ
- ๋ฐ์ดํฐ์๊ฐํ
- ๋ฐ์ดํฐ๋ถ์
- ์๋ฒ ๋ฉ
- ์ ํ๋์ํ
- ํ์ดํ๋
- c++
- Kaggle
- ์ธํ๋ฐ
- ์๊ณ ๋ฆฌ์ฆ
- nlp
- react
- Git
- ๋จธ์ ๋ฌ๋
- ๋ฅ๋ฌ๋
- ๋ถ์
- ์๋๋ก์ด๋์คํ๋์ค
- Today
- Total
yeon's ๐ฉ๐ป๐ป
ํ์ดํผ ํ๋ผ๋ฏธํฐ, GridSearchCV ๋ณธ๋ฌธ
https://dsbook.tistory.com/135
[ํ์ด์ฌ ๋จธ์ ๋ฌ๋ ์๋ฒฝ๊ฐ์ด๋] : ์ฌ์ดํท ๋ฐ ํ์ดํผ ํ๋ผ๋ฏธํฐ & GridSearchCV - 3
โป HyperParameter(ํ์ดํผ ํ๋ผ๋ฏธํฐ)๋? ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๊ณต๋ถ๋ฅผ ํ๋ค๋ณด๋ฉด ๋ฐฐ์ด์ง ๋ง์ด ๋ฃ๋ ์ฉ์ด ์ค์ ํ๋์ด๋ค. 1. ํ๋ผ๋ฏธํฐ VS ํ์ดํผ ํ๋ผ๋ฏธํฐ ์ผ๋จ, ํ๋ผ๋ฏธํฐ๋ ์ผ๋ฐ ํจ์์์ ๊ฒฐ๊ณผ๊ฐ์ ์ป๊ธฐ
dsbook.tistory.com
๋ฅผ ๋ฐํ์ผ๋ก ํ์ฌํ๋ฉฐ ๊ณต๋ถ
* ํ์ดํผ ํ๋ผ๋ฏธํฐ(HyperParameter)
1. ํ๋ผ๋ฏธํฐ vs. ํ์ดํผ ํ๋ผ๋ฏธํฐ
- ํ๋ผ๋ฏธํฐ๋ ์ผ๋ฐ ํจ์์์ ๊ฒฐ๊ณผ๊ฐ์ ์ป๊ธฐ ์ํด ๋ฃ์ด์ผ ํ๋ ์์๋ค์ ์๋ฏธํ๋ ์ฉ์ด๋ก ๋ง์ด ์ฌ์ฉ๋๋ค.
- ํ๋ผ๋ฏธํฐ๋ค์ ์ธก์ ๋๊ฑฐ๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ต๋์ด์ง์ง ์์ ์์๋ค์ ์๋ฏธํ๊ณ , ํ๋ผ๋ฏธํฐ๋ ์์์ ์ผ๋ก ์ด๋ฃจ์ด์ง์ง ์๋๋ค.
- ์ฆ, ์ฌ์ฉ์๊ฐ ์ง์ ์ ๋ ฅํ์ง ์๋๋ค๋ ์๋ฏธ
- ๋ฐ์ดํฐ๋ฅผ ์ป์ด ๊ทธ ๋ฐ์ดํฐ์ ํ๊ท ์ด๋ ํ์คํธ์ฐจ ๋ฑ์ด ํ๋ผ๋ฏธํฐ์ ์ํ๋ค๊ณ ํ ์ ์๋ค.
- ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ง์ด ์ฐ์ด๋ ์ฉ์ด์ด๋ค.
- ๋๋ถ๋ถ ํด๋น ์๊ณ ๋ฆฌ์ฆ์ด ์ด๋ป๊ฒ ํ์ต์ ํด์ผํ๋์ง์ ๋ํ ์ค์ ์ ํด์ฃผ๊ธฐ ์ํด ์ฌ์ฉ์๊ฐ ์ง์ ๊ฐ์ ์ ๋ ฅํด์ฃผ์ด์ผ ํ๋ ์์๋ค์ ์๋ฏธํ๋ค.
- ์ฆ, ์ฌ์ฉ์๊ฐ ์ง์ ์ ๋ ฅ์ ํด์ฃผ๋๋(ํ์ดํผ ํ๋ผ๋ฏธํฐ), ์๋๋ฉด ๋ฐ์ดํฐ ๋ถ์์ ํตํด ์ป์ ๊ฐ(ํ๋ผ๋ฏธํฐ)์ ์๋ฏธํ๋์ด๋ค.
- ์๊ณ ๋ฆฌ์ฆ์ด ํ์ตํ๊ธฐ ์ด์ ์ ์ฌ์ฉ์๊ฐ ์ง์ ์ ๋ ฅํด์ฃผ๋ ์์๋ ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ผ๊ณ ๋ถ๋ฅด๊ณ ,
ํ์ตํ ํ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ ํน์ฑ๋ค์ ๊ดํ ์์๋ค์ ํ๋ผ๋ฏธํฐ๋ผ๊ณ ํ๋ค.
- but, ํ๋ผ๋ฏธํฐ์ ์๋ฏธ๋ ์ผ๋ฐ์ ์ธ ํจ์๋ค์์ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํด ๋ค์ด๊ฐ์ผ ํ ์์ ๋ผ๋ ๋ป์ผ๋ก ์ด์ฉ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
2. ์ ํ์ดํผ ํ๋ผ๋ฏธํฐ๊ฐ ํ์ํ๊ฐ?
- ๋ฐ์ดํฐ๋ ๋ฌด์ํ ๋ง๊ณ , ๋น์ทํ ์ข ๋ฅ์ ๋ฐ์ดํฐ๋ค์ด๋ผ๊ณ ํ๋๋ผ๋ ๋ถํฌ๊ฐ ๋งค์ฐ ๋ค์ํ๋ค.
- ์ด๊ฒ๋ค์ ์ผ๋ฐํ๋ ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ ๋ชจ๋ธ์ ์ ์ฉํ์ฌ ๋ชจ๋ ๊ฒฝ์ฐ์ ์ต์ ์ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋ ๊ฒ์ ๋ถ๊ฐ๋ฅํ๋ค.
- ๋ฐ๋ผ์ ๋ฐ์ดํฐ์ ํน์ฑ๋ค์ ๋ฐ๋ผ ์ฌ๋ฌ ์์๋ค์ ์ ์ ํ ๊ฐ์ผ๋ก ์ค์ ํด ์ฃผ์ด์ผ ๊ฐ๊ฐ์ ๊ฒฝ์ฐ์ ์ต๊ณ ์ ์์ธก ์ฑ๋ฅ์ ๊ฐ์ ธ์ฌ ์ ์๋ค.
- ํนํ, ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ ํ ๊ฐ์ผ๋ก ์ค์ ํ ๊ฒฝ์ฐ, ๊ณผ์ ํฉ(Overfitting)์ ํด๊ฒฐํ๋๋ฐ ํฐ ๋์์ ์ค๋ค.
* GridSearchCV
- ์ฌ์ดํท๋ฐ(scikit-learn)์๋ ํ์ดํผ ํ๋ผ๋ฏธํฐ์ ๊ด๋ จํด GridSearchCV๋ผ๋ ์ฌ์ดํท๋ฐ ๋ชจ๋์ด ์๋ค.
- GridSearchCV๋ ์ฌ์ฉ์๊ฐ ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ง๋ค ๋ช ๊ฐ์ง ๊ฐ์ ๊ฐ์ง ๋ฆฌ์คํธ๋ฅผ ์ ๋ ฅํ๋ฉด, ๊ฐ๋ฅํ ํ์ดํผ ํ๋ผ๋ฏธํฐ์ ๊ฒฝ์ฐ์ ์๋ง๋ค ์์ธก ์ฑ๋ฅ์ ์ธก์ ํ์ฌ ์ฌ์ฉ์๊ฐ ์ผ์ผ์ด ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ฅผ ์ค์ ํ๊ณ , ์์ธก ์ฑ๋ฅ์ ๋น๊ตํ์ฌ ์ต์ ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋ ์๊ณ ๋ฅผ ์ค์ด๊ณ ์ด ๊ณผ์ ์ ํ๊บผ๋ฒ์ ์งํํ๋ค.
* GirdSearchCV API ์ฌ์ฉ๋ฒ
1. train_test_split()์ ํตํด ํ์ต ๋ฐ์ดํฐ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฆฌํ๋ค.
2. ํ์ดํผ ํ๋ผ๋ฏธํฐ ์ธํธ๋ฅผ ๋์ ๋๋ฆฌ ํํ๋ก ๋ณ์์ ์ ์ฅํ๋ค.
parameters = {'max_depth': [1, 2, 3],
'min_samples_split': [2, 3]}
- 'max_depth'์ 'min_samples_list'๋ ๊ฒฐ์ ํธ๋ฆฌ๊ฐ ๊ฐ์ง๊ณ ์๋ ํ์ดํผ ํ๋ผ๋ฏธํฐ์ ์ข ๋ฅ์ด๋ค.
3. GridSearchCV ๊ฐ์ฒด์ fit(ํ์ต ๋ฐ์ดํฐ ์ธํธ) ๋งค์๋์ ์ธ์๋ก ์ ๋ ฅํ๋ค.
- fit ๋ฉ์๋๋ ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ค์ ์์ฐจ์ ์ผ๋ก ๋ณ๊ฒฝํ์ฌ ํ์ต๊ณผ ํ๊ฐ๋ฅผ ์ํํ๋ค.
- ๊ทธ ํ, cv_result_๋ผ๋ ์์ฑ์ ๊ธฐ๋กํ๋ค.
- ์ด cv_result_๋ gridsearchcv์ ๊ฒฐ๊ณผ ์ธํธ๋ก์ ๋์ ๋๋ฆฌ ํํ๋ฅผ ๊ฐ์ง๋ค.
4. cv_result_๊ฐ ๋์ ๋๋ฆฌ ํํ๋ฅผ ๊ฐ์ง ๊ฒ์ ์ด์ฉํด pandas์ dataframe์ผ๋ก ๋ณํํ๋ฉด ํด๋น ๊ฒฐ๊ณผ๋ฅผ ํธํ๊ฒ ๋ณผ ์ ์๋ค.
'Computer ๐ป > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋๋ค ํฌ๋ ์คํธ (Random Forest) (0) | 2021.08.31 |
---|---|
์ ํ ๋ชจ๋ธ (0) | 2021.08.27 |
์์๋ธ(ensemble) - Random Forest / Gradient Boosting (0) | 2021.08.26 |
์ ํ ํ๊ท / ๋ฆฟ์ง ํ๊ท / ๋ผ์ ํ๊ท (0) | 2021.08.25 |
๊ณผ๋์ ํฉ(Overfitting) vs. ๊ณผ์์ ํฉ(Underfitting) (0) | 2021.08.25 |