์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- Git
- ๋ฆฌ์กํธ
- ๋์
- ๋จธ์ ๋ฌ๋
- ์ธํ๋ฐ
- ์๊ณ ๋ฆฌ์ฆ
- ๊ฒฐ์ ํธ๋ฆฌ
- Titanic
- linearalgebra
- ์ํ์ฝ๋ฉ
- ๋ฐ์ดํฐ์๊ฐํ
- react
- ๋ถ์
- ๋ฐ์ดํฐ
- ๋ฐ์ดํฐ๋ถ์
- ์๋๋ก์ด๋์คํ๋์ค
- ๋ค์ดํฐ๋ธ
- ์ ํ๋์ํ
- native
- ๋ฅ๋ฌ๋
- cs231n
- ๊นํ
- AI
- ๋ฐฑ์ค
- ํ์ดํ๋
- Kaggle
- nlp
- ์๋ฒ ๋ฉ
- c++
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- Today
- Total
yeon's ๐ฉ๐ป๐ป
๊ฒฐ์ ํธ๋ฆฌ(Decision Tree) ๋ณธ๋ฌธ
๋จธ์ ๋ฌ๋ - 4. ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)
๊ฒฐ์ ํธ๋ฆฌ(Decision Tree, ์์ฌ๊ฒฐ์ ํธ๋ฆฌ, ์์ฌ๊ฒฐ์ ๋๋ฌด๋ผ๊ณ ๋ ํจ)๋ ๋ถ๋ฅ(Classification)์ ํ๊ท(Regression) ๋ชจ๋ ๊ฐ๋ฅํ ์ง๋ ํ์ต ๋ชจ๋ธ ์ค ํ๋์ ๋๋ค. ๊ฒฐ์ ํธ๋ฆฌ๋ ์ค๋ฌด๊ณ ๊ฐ ํ๋ฏ์ด ์/์๋์ค ์ง๋ฌธ์
bkshin.tistory.com
๋ฅผ ๋ฐํ์ผ๋ก ํ์ฌํ๋ฉฐ ๊ณต๋ถ
* ๊ฒฐ์ ํธ๋ฆฌ (Decision Tree, ์์ฌ ๊ฒฐ์ ํธ๋ฆฌ, ์์ฌ ๊ฒฐ์ ๋๋ฌด)
- ๋ถ๋ฅ (Classification)์ ํ๊ท(Regression) ๋ชจ๋ ๊ฐ๋ฅํ ์ง๋ ํ์ต ๋ชจ๋ธ ์ค ํ๋
- ๊ฒฐ์ ํธ๋ฆฌ๋ ์ค๋ฌด๊ณ ๊ฐ ํ๋ฏ์ด ์/์๋์ค ์ง๋ฌธ์ ์ด์ด๊ฐ๋ฉฐ ํ์ตํ๋ค.
ex) ๋งค, ํญ๊ท, ๋๊ณ ๋, ๊ณฐ์ ๊ตฌ๋ถํ๋ค๊ณ ์๊ฐํด๋ณด์.
- ๋งค์ ํญ๊ท์ ๋ ๊ฐ๊ฐ ์๊ณ , ๋๊ณ ๋์ ๊ณฐ์ ๋ ๊ฐ๊ฐ ์๋ค.
- '๋ ๊ฐ๊ฐ ์๋์?' ๋ผ๋ ์ง๋ฌธ์ ํตํด ๋งค, ํญ๊ท / ๋๊ณ ๋, ๊ณฐ ์ ๋๋ ์ ์๋ค.
- ๋งค์ ํญ๊ท์ '๋ ์ ์๋์?' ๋ผ๋ ์ง๋ฌธ์ ํตํด ๋๋ ์ ์๊ณ ,
๋๊ณ ๋์ ๊ณฐ์ '์ง๋๋ฌ๋ฏธ๊ฐ ์๋์?' ๋ผ๋ ์ง๋ฌธ์ ํตํด ๋๋ ์ ์๋ค.
- ์ด๋ ๊ฒ ํน์ ๊ธฐ์ค (์ง๋ฌธ)์ ๋ฐ๋ผ ๋ฐ์ดํฐ๋ฅผ ๊ตฌ๋ถํ๋ ๋ชจ๋ธ์ ๊ฒฐ์ ํธ๋ฆฌ ๋ชจ๋ธ์ด๋ผ๊ณ ํ๋ค.
- ํ ๋ฒ์ ๋ถ๊ธฐ ๋๋ง๋ค ๋ณ์ ์์ญ์ ๋ ๊ฐ๋ก ๊ตฌ๋ถํ๋ค.
- ๊ฒฐ์ ํธ๋ฆฌ์์ ์ง๋ฌธ์ด๋ ์ ๋ต์ ๋ด์ ๋ค๋ชจ ์์ : ๋ ธ๋(Node)
- ๋งจ ์ฒซ ๋ถ๋ฅ ๊ธฐ์ค (์ฒซ ์ง๋ฌธ) : Root Node
- ๋งจ ๋ง์ง๋ง ๋ ธ๋ : Terminal Node / Leaf Node
- ์ ์ฒด์ ์ธ ๋ชจ์์ด ๋๋ฌด๋ฅผ ๋ค์ง์ด ๋์ ๊ฒ๊ณผ ๊ฐ์ ์ด๋ฆ์ด Decision Tree์ด๋ค.
* ๊ฒฐ์ ํธ๋ฆฌ ์๊ณ ๋ฆฌ์ฆ์ ํ๋ก์ธ์ค
- ๋จผ์ ์์ ๊ฐ์ด ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ์ ๊ตฌ๋ถํ ์ ์๋ ์ง๋ฌธ์ ๊ธฐ์ค์ผ๋ก ๋๋
- ๋๋ ๊ฐ ๋ฒ์ฃผ์์ ๋ ๋ค์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ์ ๊ตฌ๋ถํ ์ ์๋ ์ง๋ฌธ์ ๊ธฐ์ค์ผ๋ก ๋๋
- but, ์ง๋์น๊ฒ ๋ง์ดํ๋ฉด ์๋์ ๊ฐ์ด ์ค๋ฒํผํฐ์ ๋จ.
- ๊ฒฐ์ ํธ๋ฆฌ์ ์๋ฌด ํ๋ผ๋ฏธํฐ๋ฅผ ์ฃผ์ง ์๊ณ ๋ชจ๋ธ๋งํ๋ฉด ์ค๋ฒํผํ ์ด ๋๋ค.
* ๊ฐ์ง์น๊ธฐ (Pruning)
- ์ค๋ฒํผํ ์ ๋ง๊ธฐ ์ํ ์ ๋ต์ผ๋ก ๊ฐ์ง์น๊ธฐ(Pruning)๋ผ๋ ๊ธฐ๋ฒ์ด ์์
- ํธ๋ฆฌ์ ๊ฐ์ง๊ฐ ๋๋ฌด ๋ง๋ค๋ฉด ์ค๋ฒํผํ ์ด๋ผ ๋ณผ ์ ์์
- ๊ฐ์ง์น๊ธฐ: ๋๋ฌด์ ๊ฐ์ง๋ฅผ ์น๋ ์์
์ฆ, ์ต๋ ๊น์ด๋ ํฐ๋ฏธ๋ ๋ ธ๋์ ์ต๋ ๊ฐ์, ํน์ ํ ๋ ธ๋๊ฐ ๋ถํ ํ๊ธฐ ์ํ ์ต์ ๋ฐ์ดํฐ ์๋ฅผ ์ ํํ๋ ๊ฒ
- min_sample_split ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ์ฌ ํ ๋ ธ๋์ ๋ค์ด์๋ ์ต์ ๋ฐ์ดํฐ ์๋ฅผ ์ ํด์ฃผ๊ธฐ
- min_sample_split=10 ์ด๋ฉด ํ ๋ ธ๋์ 10๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์๋ค๋ฉด, ๊ทธ ๋ ธ๋๋ ๋ ์ด์ ๋ถ๊ธฐ๋ฅผ ํ์ง ์์
- max_depth๋ฅผ ํตํด ์ต๋ ๊น์ด๋ฅผ ์ง์ ํด์ค ์๋ ์๋ค.
- max_depth=4 ๋ผ๋ฉด, ๊น์ด๊ฐ 4๋ณด๋ค ํฌ๊ฒ ๊ฐ์ง๋ฅผ ์น์ง ์๋๋ค.
- ๊ฐ์ง์น๊ธฐ๋ ์ฌ์ ๊ฐ์ง์น๊ธฐ์ ์ฌํ ๊ฐ์ง์น๊ธฐ๊ฐ ์์ง๋ง sklearn์์๋ ์ฌ์ ๊ฐ์ง์น๊ธฐ๋ง ์ง์ํ๋ค.
* ์๊ณ ๋ฆฌ์ฆ: ์ํธ๋กํผ(Entropy), ๋ถ์๋(Impurity)
- ๋ถ์๋(Impurity): ํด๋น ๋ฒ์ฃผ ์์ ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ๊ฐ ์ผ๋ง๋ ์์ฌ ์๋์ง
- ์๋ ๊ทธ๋ฆผ์์ ์์ชฝ ๋ฒ์ฃผ๋ ๋ถ์๋๊ฐ ๋ฎ๊ณ , ์๋์ชฝ ๋ฒ์ฃผ๋ ๋ถ์๋๊ฐ ๋๋ค.
- ์ฆ, ์์ชฝ ๋ฒ์ฃผ๋ ์๋(Purity)๊ฐ ๋๊ณ , ์๋์ชฝ ๋ฒ์ฃผ๋ ์๋๊ฐ ๋ฎ๋ค.
- ์์ชฝ ๋ฒ์ฃผ๋ ๋ค ๋นจ๊ฐ์ ์ธ๋ฐ ํ๋๋ง ํ๋์ ์ด๋ฏ๋ก ๋ถ์๋๊ฐ ๋ฎ๋ค.
- ๋ฐ๋ฉด ์๋์ชฝ ๋ฒ์ฃผ๋ 5๊ฐ๋ ํ๋์ , 3๊ฐ๋ ๋นจ๊ฐ์ ์ผ๋ก ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ๊ฐ ๋ง์ด ์์ฌ ์์ด ๋ถ์๋๊ฐ ๋๋ค.
- ํ ๋ฒ์ฃผ์ ํ๋์ ๋ฐ์ดํฐ๋ง ์๋ค๋ฉด ๋ถ์๋๊ฐ ์ต์(์๋๋ ์ต๋)์ด๊ณ ,
ํ ๋ฒ์ฃผ์ ์๋ก ๋ค๋ฅธ ๋ ๋ฐ์ดํฐ๊ฐ ์ ํํ ๋ฐ๋ฐ ์๋ค๋ฉด ๋ถ์๋๊ฐ ์ต๋(์๋๋ ์ต์)์ด๋ค.
- ๊ฒฐ์ ํธ๋ฆฌ๋ ๋ถ์๋๋ฅผ ์ต์ํ(์๋ ์ต๋ํ)ํ๋ ๋ฐฉํฅ์ผ๋ก ํ์ต์ ์งํํ๋ค.
- ์ํธ๋กํผ(Entropy) : ๋ถ์๋(Impurity)๋ฅผ ์์น์ ์ผ๋ก ๋ํ๋ธ ์ฒ๋
- ์ํธ๋กํผ๊ฐ ๋๋ค = ๋ถ์๋๊ฐ ๋๋ค
์ํธ๋กํผ๊ฐ ๋ฎ๋ค = ๋ถ์๋๊ฐ ๋ฎ๋ค
- ์ํธ๋กํผ = 1 : ๋ถ์๋ ์ต๋ / ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ๊ฐ ์ ํํ ๋ฐ๋ฐ ์๋ค.
์ํธ๋กํผ = 0 : ๋ถ์๋ ์ต์ / ํ ๋ฒ์ฃผ ์์ ํ๋์ ๋ฐ์ดํฐ๋ง ์๋ค.
- ์ํธ๋กํผ ๊ตฌํ๋ ๊ณต์:
(pi = ํ ์์ญ ์์ ์กด์ฌํ๋ ๋ฐ์ดํฐ ๊ฐ์ด๋ฐ, ๋ฒ์ฃผ i์ ์ํ๋ ๋ฐ์ดํฐ ๋น์จ)
* ์ ๋ณด ํ๋ (Information gain)
- ์ํธ๋กํผ๊ฐ 1 -> 0.7 ๋ก ๋ฐ๋์๋ค๋ฉด ์ ๋ณด ํ๋(information gain)์ 0.3์ด๋ค.
- ์ ๋ณด ํ๋: (๋ถ๊ธฐ ์ด์ ์ ์ํธ๋กํผ) - (๋ถ๊ธฐ ์ดํ์ ์ํธ๋กํผ)
Information gain = entropy(parent) - [weighted average] entropy(children)
- entropy(parent)๋ ๋ถ๊ธฐ ์ด์ ์ ์ํธ๋กํผ์ด๊ณ , entropy(chlidren)์ ๋ถ๊ธฐ ์ดํ์ ์ํธ๋กํผ
- [weighted average] entropy(children)์ entropy(children)์ ๊ฐ์ค ํ๊ท ์ ์๋ฏธ
- ๋ถ๊ธฐ ์ดํ ์ํธ๋กํผ์ ๋ํด ๊ฐ์ค ํ๊ท ์ ํ๋ ์ด์ ๋ ๋ฒ์ฃผ๊ฐ 2๊ฐ ์ด์์ผ๋ก ์ชผ๊ฐ์ง๊ธฐ ๋๋ฌธ
- ๊ฒฐ์ ํธ๋ฆฌ ์๊ณ ๋ฆฌ์ฆ์ ์ ๋ณด ํ๋์ ์ต๋ํํ๋ ๋ฐฉํฅ์ผ๋ก ํ์ต์ด ์งํ๋๋ค.
- ์ด๋ feature์ ์ด๋ ๋ถ๊ธฐ์ ์์ ์ ์ต ํ๋์ด ์ต๋ํ๋๋์ง ํ๋จํ๊ธฐ ์ํด ๋ถ๊ธฐ๊ฐ ์งํ๋๋ค.
* ์ค์ต
- ์ ๋ฐ์ ์ธ ๋ฐฉ์์ ์ง๊ธ๊น์ง ํ๋ ๋ค๋ฅธ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๊ณผ ์ ์ฌ
- Classifier๋ฅผ ๋ง๋ค๊ณ , fittingํ ๋ค, Testํด๋ณธ๋ค.
- Classifier๋ง DecisionTreeClassifier์ ์ฌ์ฉํ๋ค๋ ๊ฒ ๋นผ๊ณ ๋ ๋ค๋ฅธ๊ฒ ์๋ค.
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
cancer = load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(
cancer.data, cancer.target, stratify=cancer.target, random_state=42)
tree = DecisionTreeClassifier(random_state=0)
tree.fit(X_train, y_train)
print("ํ๋ จ ์ธํธ ์ ํ๋: {:.3f}".format(tree.score(X_train, y_train)))
print("ํ
์คํธ ์ธํธ ์ ํ๋: {:.3f}".format(tree.score(X_test, y_test)))
>>> ํ๋ จ ์ธํธ ์ ํ๋: 1.000
>>> ํ
์คํธ ์ธํธ ์ ํ๋: 0.937
- ๊ฒฐ์ ํธ๋ฆฌ์ default๋ max_depth, min_sample_split ์ ํ์ด ์์ผ๋ฏ๋ก ํ ๋ฒ์ฃผ์ ํ ์ข ๋ฅ์ ๋ฐ์ดํฐ๊ฐ ๋จ์ ๋๊น์ง ๊ฐ์ง๋ฅผ ์น๋ค.
- ๋ฐ๋ผ์ ํ๋ จ ์ธํธ์ ์ ํ๋๋ 100%์ด์ง๋ง ํ ์คํธ ์ธํธ์ ์ ํ๋๋ 93.7%์ด๋ค.
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
print("ํ๋ จ ์ธํธ ์ ํ๋: {:.3f}".format(tree.score(X_train, y_train)))
print("ํ
์คํธ ์ธํธ ์ ํ๋: {:.3f}".format(tree.score(X_test, y_test)))
>>> ํ๋ จ ์ธํธ ์ ํ๋: 0.988
>>> ํ
์คํธ ์ธํธ ์ ํ๋: 0.951
- ๋ฐ๋ฉด max_depth=4๋ก ์ค์ ํด์ฃผ๋ฉด ์ค๋ฒํผํ ์ ๋ง์ ํ๋ จ ์ธํธ ์ ํ๋๋ ์ข ๋ ๋ ์ง์ง๋ง, ํ ์คํธ ์ธํธ ์ ํ๋๊ฐ ๋ ๋์์ก๋ค.
* ์ํธ๋กํผ ์์
- ์ ํ๋ ๊ฒฝ์ฌ, ํ๋ฉด, ์๋ ์ ํ์ ๊ธฐ์ค์ผ๋ก ์๋๊ฐ ๋๋ฆฐ์ง ๋น ๋ฅธ์ง ๋ถ๋ฅํด๋์ ํ
- X variables๊ฐ ๊ฒฝ์ฌ, ํ๋ฉด, ์๋ ์ ํ์ด๊ณ , Y variable์ด ์๋
- ์ด ๋ ์ํธ๋กํผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ฒฐ์ ํธ๋ฆฌ๋ฅผ ๋ชจ๋ธ๋ง ํด๋ณด๊ฒ ๋ค.
- ์๋ ๋ผ๋ฒจ์๋ slow, slow, fast, fast ์ด 4๊ฐ์ examples๋ค์ด ์๋ค.
- Pi๋ ํ ์์ญ ์์ ์กด์ฌํ๋ ๋ฐ์ดํฐ ๊ฐ์ด๋ฐ ๋ฒ์ฃผ i์ ์ํ๋ ๋ฐ์ดํฐ์ ๋น์จ
- i๊ฐ slow๋ผ๋ฉด slow ๋ผ๋ฒจ ๊ฐฏ์ = 2๊ฐ, ์ ์ฒด ๋ผ๋ฒจ ๊ฐฏ์ = 4๊ฐ ์ด๊ธฐ ๋๋ฌธ์ P_slow = 2/4 = 0.5
- ๋ง์ฐฌ๊ฐ์ง๋ก P_fast = 0.5
- ๊ทธ๋ ๋ค๋ฉด, ํ์ฌ ๋ฒ์ฃผ ์ ์ฒด์ ์ํธ๋กํผ๋? 1
- ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ๊ฐ ์ ํํ ๋ฐ๋ฐ ์๊ธฐ ๋๋ฌธ
- ์์์ ๋ณธ ์ํธ๋กํผ ๊ณต์์ ๊ทธ๋๋ก ๋์ ํด ์คํธ๋กํผ๋ฅผ ๊ตฌํด๋ณด์
Entropy = -P_slow*log2(P_slow) - P_fast*log2(P_fast)
= -05 * log2(0.5) - 0.5 * log2(0.5) = 1
* ๊ฒฝ์ฌ ๊ธฐ์ค ๋ถ๊ธฐ
- ๋จผ์ ๊ฒฝ์ฌ(grade)๋ฅผ ๊ธฐ์ค์ผ๋ก ์ฒซ ๋ถ๊ธฐ๋ฅผ ํด๋ณด์.
- ์ ์ฒด ๋ฐ์ดํฐ ์ค steep์ 3๊ฐ, ์ด ๋์ ์๋๋ ๊ฐ๊ฐ slow, slow, fast์ด๋ค.
- flat์ ๋ฐ์ดํฐ๋ ์ด 1๊ฐ, ์ด ๋์ ์๋๋ fast
- flat์ ํด๋นํ๋ ๋ ธ๋์ ์ํธ๋กํผ๋?
- ์ค๋ฅธ์ชฝ ๋ ธ๋์์ ํ ๋ ธ๋์ fast๋ผ๋ ํ๋์ ๋ฐ์ดํฐ๋ง ์กด์ฌํ๊ธฐ ๋๋ฌธ์ ์ํธ๋กํผ๋ 0์ด๋ค.
- ๋ฐ๋ผ์, entropy(flat) = 0
- entropy(steep)์ ์ผ์ชฝ ๋ ธ๋
- slow๊ฐ 2๊ฐ, fast๊ฐ 1๊ฐ
- entropy(steep) = - P_slow * log2(P_slow) - P_fast * log2(P_fast)
= -(2/3) * logw(2/3) - (1/3) * log2(1/3)
= 0.9184
- ๋ถ๊ธฐ ์ดํ ๋ ธ๋์ ๋ํ ๊ฐ์ค ํ๊ท ๊ตฌํด๋ณด์
- [weighted average] entropy(children)
= weighted average of steep * entropy(steep) + weighted average of flat * entropy(flat)
= (3/4) * (0.9184) + (1/4) * 0
= 0.6888
- ๋ฐ๋ผ์ ๊ฒฝ์ฌ(grade)๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ถ๊ธฐํ ํ์ ์ํธ๋กํผ๋ 0.6888
- ์ด์ ์ ๋ณด ํ๋ ๊ณต์์ ํตํด ์ ๋ณด ํ๋๋์ ๊ตฌํด๋ณด์
- information gain
= entropy(parent) - [weighted average] entropy(children)
= 1 - 0.6888
= 0.3112
- ๊ฒฝ์ฌ feature๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ถ๊ธฐ๋ฅผ ํ์ ๋๋ 0.3112๋งํผ์ ์ ๋ณด ํ๋(information gain)์ด ์๋ค๋ ๋ป!
* ํ๋ฉด ๊ธฐ์ค ๋ถ๊ธฐ
- ํ๋ฉด(bumpiness)๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ถ๊ธฐ ํ์ ๋๋ bumpy์ slow, fast, smooth์๋ slow, fast๊ฐ ์๋ค.
- ํ๋์ ๋ฒ์ฃผ์ ๋ํด ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ๊ฐ ์ ํํ ๋ฐ๋ฐ์ด๋ฏ๋ก ์ํธ๋กํผ๋ 1.
- entropy(bumpy) = - P_slow * log2(P_slow) - P_fast * log2(P_fast) = 1
- entropy(smooth) = - P_slow * log2(P_slow) - P_fast * log2(P_fast) = 1
- [weighted average] entropy(children)
= weighted average of bumpy * entropy(bumpy) + weighted average of smooth * entropy(smooth)
= (2/4) * 1 + (2/4) * 1
= 1
- information gain = entropy(parent) - [weighted average] entropy(children) = 1 - 1 = 0
- ํ๋ฉด์ ๊ธฐ์ค์ผ๋ก ๋ถ๊ธฐํ์ ๋๋ ์ ๋ณด ํ๋์ด ์ ํ ์๋ค๋ ๋ป!!
* ์๋ ์ ํ ๊ธฐ์ค ๋ถ๊ธฐ
- entropy(yes) = -P_slow * log2(P_slow) - P_fast * log2(P_fast) = -1 * log2(1) - 0 * log2(0) = 0
- entropy(no) = -P_slow * log2(P_slow) - P_fast * log2(P_fast) = 0 * log2(0) - 1 * log(1) = 0
๋ฐ๋ผ์, information gain = 1 - (2/4) * 0 - (2/4) * 0 = 1
- ๊ฒฝ์ฌ, ํ๋ฉด, ์๋์ ํ ๊ธฐ์ค์ผ๋ก ๋ถ๊ธฐํ์ ๋ ์ ๋ณด ํ๋์ ๊ฐ๊ฐ 0.3112, 0, 1์ด๋ค.
- ๊ฒฐ์ ํธ๋ฆฌ๋ ์ ๋ณด ํ๋์ด ๊ฐ์ฅ ๋ง์ ๋ฐฉํฅ์ผ๋ก ํ์ต์ด ์งํ๋๋ค.
- ๋ฐ๋ผ์ ์ฒซ ๋ถ๊ธฐ์ ์ ์๋์ ํ ๊ธฐ์ค์ผ๋ก ์ก๋๋ค.
- ์ด๋ฐ์์ผ๋ก max_depth๋ min_sample_split์ผ๋ก ์ค์ ํ ๋ฒ์๊น์ง ๋ถ๊ธฐ๋ฅผ ํ๊ฒ ๋๋ค.
- ์ด๊ฒ์ด ๋ฐ๋ก ๊ฒฐ์ ํธ๋ฆฌ์ ์ ์ฒด์ ์ธ ์๊ณ ๋ฆฌ์ฆ
'Computer ๐ป > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ฒจ๋(Kurtosis)์ ์๋(Skewness) (0) | 2021.09.10 |
---|---|
๋๋ค ํฌ๋ ์คํธ(Random Forest) (0) | 2021.08.31 |
๋๋ค ํฌ๋ ์คํธ (Random Forest) (0) | 2021.08.31 |
์ ํ ๋ชจ๋ธ (0) | 2021.08.27 |
ํ์ดํผ ํ๋ผ๋ฏธํฐ, GridSearchCV (0) | 2021.08.26 |