๊ด€๋ฆฌ ๋ฉ”๋‰ด

yeon's ๐Ÿ‘ฉ๐Ÿป‍๐Ÿ’ป

์—์ด๋‹ค ๋ถ€์ŠคํŠธ (AdaBoost) ๋ณธ๋ฌธ

Computer ๐Ÿ’ป/Machine Learning

์—์ด๋‹ค ๋ถ€์ŠคํŠธ (AdaBoost)

yeon42 2021. 11. 7. 17:12
728x90

 

https://bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-14-AdaBoost?category=1057680 

 

๋จธ์‹ ๋Ÿฌ๋‹ - 14. ์—์ด๋‹ค ๋ถ€์ŠคํŠธ(AdaBoost)

๋ณธ ์ฑ•ํ„ฐ์—์„œ๋Š” ๋ถ€์ŠคํŒ… ๊ธฐ๋ฒ• ์ค‘ ๊ฐ€์žฅ ๊ธฐ๋ณธ์ด ๋˜๋Š” AdaBoost์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ๋ถ€์ŠคํŒ…์— ๋Œ€ํ•ด์„œ ์ž˜ ๋ชจ๋ฅด์‹ ๋‹ค๋ฉด '๋จธ์‹ ๋Ÿฌ๋‹ - 11. ์•™์ƒ๋ธ” ํ•™์Šต (Ensemble Learning): ๋ฐฐ๊น…(Bagging)๊ณผ ๋ถ€์ŠคํŒ…(Boosting)'์„ ์ฐธ

bkshin.tistory.com

์œ„ ๋ธ”๋กœ๊ทธ๋ฅผ ํ•„์‚ฌํ•˜๋ฉฐ ๊ณต๋ถ€

 

* ๋ชจ๋“  ํ…์ŠคํŠธ์™€ ์ด๋ฏธ์ง€์˜ ์ถœ์ฒ˜๋Š” ์œ„ ๋ธ”๋กœ๊ทธ์ž…๋‹ˆ๋‹ค.

 


 

 

AdaBoost์˜ ๊ฐœ์š”

 

์•„๋ž˜์™€ ๊ฐ™์ด ๋…ธ๋“œ 1๊ฐœ์— 2๊ฐœ์˜ ๋ฆฌํ”„(leaf)๋ฅผ ์ง€๋‹Œ ํŠธ๋ฆฌ๋ฅผ stump๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ถœ์ฒ˜: StatQuest

 

AdaBoost๋Š” ์•„๋ž˜์™€ ๊ฐ™์ด ์—ฌ๋Ÿฌ ๊ฐœ์˜ stump๋กœ ๊ตฌ์„ฑ์ด ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ Forest of stumps๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ถœ์ฒ˜: StatQuest

 

ํŠธ๋ฆฌ์™€ ๋‹ค๋ฅด๊ฒŒ stump๋Š” ์ •ํ™•ํžˆ ๋ถ„๋ฅ˜๋ฅผ ํ•˜์ง€ ๋ชปํ•œ๋‹ค.

์—ฌ๋Ÿฌ ์งˆ๋ฌธ์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ํŠธ๋ฆฌ์™€ ๋‹ค๋ฅด๊ฒŒ, stump๋Š” ๋‹จ ํ•˜๋‚˜์˜ ์งˆ๋ฌธ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ํ•ด์•ผํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

๋”ฐ๋ผ์„œ stump๋Š” ์•ฝํ•œ ํ•™์Šต๊ธฐ (weak learner)์ด๋‹ค.

 

๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ๋Š” ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํŠธ๋ฆฌ์˜ ๊ฒฐ๊ณผ๋ฅผ ํ•ฉ์‚ฐํ•ด ๋‹ค์ˆ˜๊ฒฐ์˜ ์›์น™์„ ํ†ตํ•ด ์ตœ์ข… ๊ฒฐ๊ณผ๋ฅผ ๋‚ธ๋‹ค.

์ตœ์ข… ๋ถ„๋ฅ˜๋ฅผ ํ•˜๋Š”๋ฐ ์žˆ์–ด ๊ฐ ํŠธ๋ฆฌ๋Š” ๋™๋“ฑํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ์ง€๋‹Œ๋‹ค.

 

์ถœ์ฒ˜: StatQuest

 

ํ•˜์ง€๋งŒ AdaBoost์—์„œ ํŠน์ • stump๋Š” ๋‹ค๋ฅธ stump๋ณด๋‹ค ๋” ์ค‘์š”ํ•˜๋‹ค. ์ฆ‰, ๊ฐ€์ค‘์น˜๊ฐ€ ๋” ๋†’๋‹ค.

์•„๋ž˜์˜ ๊ทธ๋ฆผ์—์„œ ํฌ๊ธฐ๊ฐ€ ํฐ ๊ฒƒ์€ ๊ฐ€์ค‘์น˜๊ฐ€ ๋” ๋†’์€ stump๋ฅผ ๋œปํ•œ๋‹ค.

์—ฌ๊ธฐ์„œ ๊ฐ€์ค‘์น˜๊ฐ€ ๋†’๋‹ค๋Š” ๊ฒƒ์€ Amount of Say๊ฐ€ ๋†’๋‹ค๊ณ  ํ‘œํ˜„ํ•œ๋‹ค. (๊ฒฐ๊ณผ์— ๋ฏธ์น˜๋Š” ์˜ํ–์ž‰ ํฌ๋‹ค๋Š” ๋œป)

์ถœ์ฒ˜: StatQuest

 

๋˜ํ•œ, ์ฒซ ๋ฒˆ์งธ stump์—์„œ ๋ฐœ์ƒํ•œ error์€ ๋‘ ๋ฒˆ์งธ stump์˜ ๊ฒฐ๊ณผ์— ์˜ํ–ฅ์„ ์ค€๋‹ค.

๋‘ ๋ฒˆ์งธ stump์—์„œ ๋ฐœ์ƒํ•œ error ์—ญ์‹œ ์„ธ ๋ฒˆ์งธ stump์˜ ๊ฒฐ๊ณผ์— ์˜ํ–ฅ์„ ์ค€๋‹ค.

๊ทธ๋ ‡๊ฒŒ ๋งˆ์ง€๋ง‰ stump๊นŒ์ง€ ์ค„์ค„์ด ์˜ํ–ฅ์„ ์ค€๋‹ค

 

์ •๋ฆฌํ•˜์ž๋ฉด, AdaBoost๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ 3๊ฐ€์ง€ ํŠน์ง•์„ ๊ฐ€์ง„๋‹ค.

1. ์•ฝํ•œ ํ•™์Šต๊ธฐ(weak learner)๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์œผ๋ฉฐ, ์•ฝํ•œ ํ•™์Šต๊ธฐ๋Š” stump์˜ ํ˜•ํƒœ์ด๋‹ค.

2. ์–ด๋–ค stump๋Š” ๋‹ค๋ฅธ stump๋ณด๋‹ค ๊ฐ€์ค‘์น˜๊ฐ€ ๋†’๋‹ค. (Amount of Say๊ฐ€ ํฌ๋‹ค.)

3. ๊ฐ stump์˜ error์€ ๋‹ค์Œ stump์˜ ๊ฒฐ๊ณผ์— ์˜ํ–ฅ์„ ์ค€๋‹ค.

 

 

 

 

AdaBoost์˜ ์ž‘๋™ ์›๋ฆฌ

 

์ถœ์ฒ˜: StatQuest

Chest Pain, Blocked Arteries, Patient Weigth์— ๋”ฐ๋ฅธ Heart Disease ์—ฌ๋ถ€์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์ด๋‹ค.

๋งจ ์ฒ˜์Œ Sample Weight๋Š” 8๊ฐœ์˜ ๋ฐ์ดํ„ฐ ๋ชจ๋‘ ๋™์ผํ•˜๊ฒŒ 1 / (total number of samples) = 1/8 ์ด๋‹ค.

๋ชจ๋“  sample์˜ ๊ฐ€์ค‘์น˜๊ฐ€ 1/8๋กœ ๋™์ผํ•˜๋‹ค.

์ด์ œ ๊ฐ๊ฐ์˜ feature๊ฐ€ target value(์—ฌ๊ธฐ์„œ๋Š” Heart Disease์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์— ๋Œ€ํ•ด ์‚ดํŽด๋ณด์ž.

 

 

 

๋‹ค์Œ์€ Chest Pain๊ณผ Heart Disease์™€์˜ ๊ด€๊ณ„์ด๋‹ค.

์ถœ์ฒ˜: StatQuest

๋‹จ์ˆœํžˆ Chest Pain์ด yes์ด๋ฉด Heart Disease๋„ yes ๋ผ๊ณ  ํŒ๋‹จํ•˜๋Š” ๋ชจ๋ธ์ด๋‹ค.

์ด 8๊ฐœ์˜ ๋ฐ์ดํ„ฐ ์ค‘ Chest Pain์ด yes์ธ ๋ฐ์ดํ„ฐ (์ฆ‰, Heart Disease๋ฅผ yes๋ผ๊ณ  ํŒ๋‹จํ•œ ๋ฐ์ดํ„ฐ)๋Š” 5๊ฐœ, no์ธ ๋ฐ์ดํ„ฐ๋Š” 3๊ฐœ์ด๋‹ค.

Heart Disease๋ฅผ yes๋ผ๊ณ  ํŒ๋‹จํ•œ ๊ฒƒ ์ค‘ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ํŒ๋‹จํ•œ ๊ฒƒ์€ 3๊ฐœ, ํ‹€๋ฆฌ๊ฒŒ ํŒ๋‹จํ•œ ๊ฒƒ์€ 2๊ฐœ์ด๋‹ค.

๋ฐ˜๋Œ€๋กœ, Heart Disease๋ฅผ no๋ผ๊ณ  ํŒ๋‹จํ•œ ๊ฒƒ ์ค‘ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ํŒ๋‹จํ•œ ๊ฒƒ์€ 2๊ฐœ, ํ‹€๋ฆฌ๊ฒŒ ํŒ๋‹จํ•œ ๊ฒƒ์€ 1๊ฐœ์ด๋‹ค.

 

 

 

๋‹ค์Œ์€ Blocked Arteries์™€ Heart Disease์™€์˜ ๊ด€๊ณ„์ด๋‹ค.

์ถœ์ฒ˜: StatQuest

 

 

๋งˆ์ง€๋ง‰์œผ๋กœ, Patient Weight์™€ Heart Disease๊ฐ„์˜ ๊ด€๊ณ„์ด๋‹ค.

์ถœ์ฒ˜: StatQuest

 

 

 

๊ฐ stump์˜ ์ง€๋‹ˆ ๊ณ„์ˆ˜๋ฅผ ๊ตฌํ•œ๋‹ค.

์ถœ์ฒ˜: StatQuest

 

๋งˆ์ง€๋ง‰ stump์˜ ์ง€๋‹ˆ ๊ณ„์ˆ˜๊ฐ€ ๊ฐ€์žฅ ์ž‘๊ธฐ ๋•Œ๋ฌธ์— forest์˜ ์ฒซ stump๋กœ ์ง€์ •ํ•œ๋‹ค.

์ด stump๊ฐ€ ์ตœ์ข… ๊ฒฐ๊ณผ ์˜ˆ์ธก์— ์žˆ์–ด ์–ผ๋งˆ๋งŒํผ์˜ ์ค‘์š”๋„๊ฐ€ ์žˆ๋Š”์ง€ ๋ณธ๋‹ค.

 

 

 

 

 

Amount of Say ๊ตฌํ•˜๊ธฐ

 

ํ‹€๋ฆฌ๊ฒŒ ๋ถ„๋ฅ˜ํ•œ ๊ฒƒ์ด No Heart Disease์˜ incorrect๋กœ 1๊ฐœ๋ฐ–์— ์—†๋‹ค.

๋”ฐ๋ผ์„œ Total Error = 1/8 ์ด๋‹ค.

์ถœ์ฒ˜: StatQuest

 

๋ชจ๋“  sample weights์˜ ํ•ฉ์€ 1์ด๊ธฐ ๋•Œ๋ฌธ์—, Total Error์€ 0~1 ์‚ฌ์ด์˜ ๊ฐ’์„ ๊ฐ€์ง„๋‹ค.

Total Error๊ฐ€ Amount of Say๋ฅผ ๊ฒฐ์ •ํ•œ๋‹ค.

Amount of Say๋Š” ์ตœ์ข… ๋ถ„๋ฅ˜์— ์žˆ์–ด ํ•ด๋‹น stump๊ฐ€ ์–ผ๋งˆ๋งŒํผ์˜ ์˜ํ–ฅ์„ ์ฃผ๋Š”๊ฐ€๋ฅผ ๋œปํ•œ๋‹ค.

 

์ถœ์ฒ˜: StatQuest

 

Amount of Say๋ฅผ ๊ทธ๋ž˜ํ”„๋กœ ๊ทธ๋ ค๋ณด๋ฉด ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™๋‹ค.

X์ถ•์€ Total Error, Y์ถ•์€ Amount of Say์ด๋‹ค.

Total Error๊ฐ€ 0์ด๋ฉด Amount of Say๋Š” ๊ต‰์žฅํžˆ ํฐ ์–‘์ˆ˜์ด๊ณ , Total Error๊ฐ€ 1์ด๋ฉด Amount of Say๋Š” ๊ต‰์žฅํžˆ ์ž‘์€ ์Œ์ˆ˜๊ฐ€ ๋œ๋‹ค.

๋”ฐ๋ผ์„œ Total Error๊ฐ€ 0๋ฉด ํ•ญ์ƒ ์˜ฌ๋ฐ”๋ฅธ ๋ถ„๋ฅ˜๋ฅผ ํ•œ๋‹ค๋Š” ๋œป์ด๊ณ , 1์ด๋ฉด ํ•ญ์ƒ ๋ฐ˜๋Œ€๋กœ ๋ถ„๋ฅ˜๋ฅผ ํ•œ๋‹ค๋Š” ๋œป์ด๋‹ค.

Total Erorr๊ฐ€ 0.5์ผ ๋•Œ๋Š” Amount of Say๊ฐ€ 0์ด๋‹ค. (๋™์ „์„ ๋˜์ง€๋Š” ๊ฒƒ๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ์˜๋ฏธ๊ฐ€ ์—†๋‹ค๋Š” ๋œป)

์ถœ์ฒ˜: StatQuest

 

๋‹ค์‹œ Stump๋กœ ๋ฌธ์ œ๋กœ ๋Œ์•„์™€, Total Error=1/8์ด๋ฏ€๋กœ,

 

์ถœ์ฒ˜: ์œ„ ๋ธ”๋กœ๊ทธ

= 0.97์ด๋‹ค.

๊ทธ๋ž˜ํ”„ ์ƒ์—์„œ ํ‘œํ˜„ํ•ด๋ณด๋ฉด, Total Error๊ฐ€ 1/8์ด๊ณ , Amount of Say=0.97์ธ ์•„๋ž˜ ์ง€์ ์ด๋‹ค.

 

์ถœ์ฒ˜: StatQuest

 

Chest Pain Stump์˜ Amount of Say๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

์ถœ์ฒ˜: StatQuest

 

์ด stump์˜ Total Error์€ 1/8 + 1/8 + 1/8 = 3/8์ด๋ฏ€๋กœ, Amount of Say๋ฅผ ๊ตฌํ•ด๋ณด๋ฉด,

 

์ถœ์ฒ˜: ์œ„ ๋ธ”๋กœ๊ทธ

= 0/42์ด๋‹ค.

 

Blocked Arteries๋„ ๋™์ผํ•œ ๋ฐฉ์‹์œผ๋กœ Amount of Say๋ฅผ ๊ตฌํ•ด์ค„ ์ˆ˜ ์žˆ๋‹ค.

 

 

 

 

 

 

์ƒ˜ํ”Œ ๊ฐ€์ค‘์น˜ ์„ค์ •

AdaBoost์—์„œ๋Š” ํ•˜๋‚˜์˜ stump๊ฐ€ ์ž˜๋ชป ๋ถ„๋ฅ˜ํ•œ sample์— ๋Œ€ํ•ด์„œ๋Š” ๋‹ค์Œ stump๋กœ ๋„˜๊ฒจ์ค„ ๋•Œ ๊ฐ€์ค‘์น˜๋ฅผ ๋” ๋†’์—ฌ ๋„˜๊ฒจ์ค€๋‹ค.

๊ทธ๋ž˜์•ผ ๋‹ค์Œ stump์—์„œ ํ•ด๋‹น sample์— ๋” ์ง‘์ค‘ํ•ด ์˜ฌ๋ฐ”๋กœ ๋ถ„๋ฅ˜ํ•ด์ฃผ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

๋งจ ์ฒ˜์Œ weight stump์—์„œ๋Š” ์•„๋ž˜ ๋นจ๊ฐ„ ๋„ค๋ชจ ์•ˆ์— ์žˆ๋Š” sample๋งŒ ์ž˜๋ชป ๋ถ„๋ฅ˜ํ–ˆ๋‹ค.

๋”ฐ๋ผ์„œ ํ•ด๋‹น sample์˜ weight๋ฅผ 1/8๋ณด๋‹ค ํฌ๊ฒŒ ํ•˜๊ณ , ๋‚˜๋จธ์ง€ sample์˜ weight๋Š” 1/8๋ณด๋‹ค ์ž‘๊ฒŒ ํ•˜์—ฌ ๋‹ค์Œ stump๋กœ ๋„˜๊ฒจ์ค€๋‹ค.

 

 

์ด์ „ stump์—์„œ ์ž˜๋ชป ๋ถ„๋ฅ˜๋œ sample์˜ ๊ฒฝ์šฐ ๋‹ค์Œ stump๋กœ ๋„˜๊ฒจ์ค„ ๋•Œ์˜ ์ƒˆ๋กœ์šด sample weight๋ฅผ ๊ตฌํ•˜๋Š” ๊ณต์‹์€ ์•„๋ž˜์™€ ๊ฐ™๋‹ค. 

์ถœ์ฒ˜: StatQuest

 

(์ด์ „ stump์—์„œ ์ž˜๋ชป ๋ถ„๋ฅ˜๋œ sample์˜) New Sample Weight = (1/8) * e^(0.97) = (1/8) * 2.64 = 0.33 ์ด๋‹ค.

๊ธฐ์กด์˜ sample weight = 1/8 = 0.125๋ณด๋‹ค ๋” ๋†’์•„์กŒ๋‹ค.

 

 

์ด์ „ stump์—์„œ ์ž˜ ๋ถ„๋ฅ˜๋œ sample์ธ ๊ฒฝ์šฐ ์ƒˆ๋กœ์šด sample weight๋ฅผ ๊ตฌํ•˜๋Š” ๊ณต์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

์ถœ์ฒ˜: StatQuest

(์ด์ „ stump์—์„œ ์ž˜ ๋ถ„๋ฅ˜๋œ sample์˜) New Sample Weight = (1/8) * e^(-0.97) = (1/8) * 0.38 = 0.05์ด๋‹ค.

๊ธฐ์กด์˜ weight์ธ 0.125๋ณด๋‹ค ๋” ์ž‘์•„์กŒ๋‹ค.

 

 

์ด๋Ÿฐ ์‹์œผ๋กœ ์ง„ํ–‰์ด ๋˜์–ด์•ผ ๋‹ค์Œ stump์—์„œ ์ด์ „ stump์—์„œ ์ž˜๋ชป ๋ถ„๋ฅ˜ํ•œ ๊ฒƒ์— ๋” ์ง‘์ค‘์„ ํ•ด ์˜ฌ๋ฐ”๋ฅธ ๋ถ„๋ฅ˜๋ฅผ ํ•ด์ฃผ๊ธฐ ๋•Œ๋ฌธใ…‡๋‹ค.

์ƒˆ๋กœ ๊ตฌํ•œ sample weight๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

 

์ถœ์ฒ˜: StatQuest

 

New Sample Weight๋Š” ๊ณต์‹์— ์˜ํ•ด ๊ตฌํ•œ weight์ด๋‹ค.

๋‹จ, ๋‹ค ๋”ํ–ˆ์„ ๋•Œ ๊ฐ’์€ 0.68๋กœ 1์ด ๋˜์ง€ ์•Š๋Š”๋‹ค.

Sample weight์˜ ํ•ฉ์€ ํ•ญ์ƒ 1์ด ๋˜์–ด์•ผ ํ•˜๋ฏ€๋กœ ์˜ค๋ฅธ์ชฝ Weight์ฒ˜๋Ÿผ ์ •๊ทœํ™”์‹œ์ผœ์ค€๋‹ค. (๊ฐ weight๋ฅผ ๋ชจ๋“  weight์˜ ํ•ฉ์œผ๋กœ ๋‚˜๋ˆ„๊ธฐ)

 

์ถœ์ฒ˜: StatQuest

 

๊ทธ ๋‹ค์Œ ์Šคํ…์€ ์ƒ˜ํ”Œ๋ง์„ ํ†ตํ•ด ์ƒˆ๋กœ์šด ํ…Œ์ด๋ธ”์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด๋‹ค.

0๋ถ€ํ„ฐ 1๊นŒ์ง€์˜ ์ˆซ์ž๋ฅผ ๋žœ๋คํ•˜๊ฒŒ ๋ฝ‘์•„ 0~0.07 ์‚ฌ์ด์˜ ์ˆซ์ž๊ฐ€ ๋‚˜์˜ค๋ฉด ์ฒซ ๋ฒˆ์งธ sample์„ ์„ ํƒํ•œ๋‹ค.

0.07~0.14๊ฐ€ ๋‚˜์˜ค๋ฉด ๋‘ ๋ฒˆ์งธ sample์„ ์„ ํƒ, 0.14~0.21์€ ์„ธ ๋ฒˆ์งธ, 0.21~0.70๊ฐ€ ๋‚˜์˜ค๋ฉด ๋„ค ๋ฒˆ์งธ sample์„ ์„ ํƒํ•œ๋‹ค.

์ฆ‰, sample weight์˜ ๋ˆ„์  ์ˆซ์ž์— ํ•ด๋‹นํ•˜๋Š” sample์„ ๋ฝ‘๋Š” ๊ฒƒ์ด๋‹ค.

๊ทธ๋ ‡๊ฒŒ ์›๋ž˜ ํ…Œ์ด๋ธ”์˜ sample ์ˆ˜์™€ ๋˜‘๊ฐ™์€ sample ์ˆ˜๋ฅผ ๊ฐ€์ง„ ์ƒˆ๋กœ์šด ํ…Œ์ด๋ธ”์„ ๊ตฌ์„ฑํ•œ๋‹ค.

๋ฝ‘ํžŒ sample๋“ค์„ ๋ณด๋‹ˆ ์ค‘๋ณต๋˜๋Š” ๊ฒƒ๋„ ์žˆ๋‹ค.

์›๋ž˜ ํ…Œ์ด๋ธ”์—์„œ sample weight๊ฐ€ 0.49์ธ sample์ด 4๋ฒˆ์ด๋‚˜ ๋ฝ‘ํ˜”๋‹ค.

(๋‹น์—ฐํžˆ 0.21~0.70 ์‚ฌ์ด์˜ ์ˆซ์ž๊ฐ€ ๋‚˜์˜ค๋ฉด ํ•ด๋‹น sample์„ ๋ฝ‘์œผ๋‹ˆ ํ™•๋ฅ ์ด ๋งŽ์„ ๊ฒƒ์ด๋‹ค.)

 

์ถœ์ฒ˜: StatQuest

 

์ด์ œ ์›๋ž˜์˜ ํ…Œ์ด๋ธ”์€ ์ง€์šฐ๊ณ , ์ƒ˜ํ”Œ๋งํ•œ ์ƒˆ๋กœ์šด ํ…Œ์ด๋ธ”์„ ๊ฐ€์ ธ์˜จ๋‹ค.

๋ชจ๋“  sample์˜ weight๋Š” ๋‹ค์‹œ 1/8๋กœ ํ†ต์ผ์‹œ์ผœ์ค€๋‹ค.

์ฒซ stump์—์„œ ์ž˜๋ชป ๋ถ„๋ฅ˜ํ–ˆ๋˜ sampel์ด 4๋ฒˆ์ด๋‚˜ ํฌํ•จ๋˜์—ˆ๋‹ค. -> sample weight๋Š” 1/8๋กœ ๋™์ผํ•˜๋”๋ผ๋„ ๋˜‘๊ฐ™์€ ๋ฐ์ดํ„ฐ๊ฐ€ 4๊ฐœ๊ฐ€ ์žˆ์–ด ์‹ค์ œ๋กœ๋Š” 4/8์˜ weight๋ฅผ ๊ฐ–๋Š” ๊ฒƒ์ด๋‹ค.

์ด๋Š” ์ฒ˜์Œ์— ์ž˜๋ชป ๋ถ„๋ฅ˜ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์—, ๊ทธ ๋‹ค์Œ์—๋Š” weight๋ฅผ ๋†’์—ฌ ์ œ๋Œ€๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์œ„ํ•จ์ด๋‹ค.

weight๊ฐ€ ๋†’์•„์ง€๋‹ˆ ํ•ด๋‹น sample์— ๊ฐ€์ค‘์น˜๋ฅผ ๋” ๋‘๊ณ  ๋ถ„๋ฅ˜ํ•  ๊ฒƒ์ด๋‹ค.

 

์ถœ์ฒ˜: StatQuest

 

๋‹ค์‹œ ๋งจ ์ฒ˜์Œ ํ–ˆ๋˜ ๊ฒƒ๊ณผ ๊ฐ™์€ ๋ฐฉ์‹์œผ๋กœ ์ง„ํ–‰ํ•˜๋ฉด ๋œ๋‹ค.

 

 

 

 

 

์ตœ์ข… ๋ถ„๋ฅ˜

 

์ด๋ ‡๊ฒŒ ์—ฌ๋Ÿฌ ์ฐจ๋ก€ ์ง„ํ–‰ํ•˜๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ๊ฐ stump ๋งˆ๋‹ค์˜ Amount of Say๊ฐ€ ๋‚˜์˜จ๋‹ค.

์™ผ์ชฝ์€ Heart Disease๊ฐ€ ์žˆ๋‹ค๊ณ  ํŒ๋‹จํ•œ stup์ด๊ณ , ์˜ค๋ฅธ์ชฝ์€ Heart Disease๊ฐ€ ์—†๋‹ค๊ณ  ํŒ๋‹จํ•œ stump์ด๋‹ค.

๊ฐ stump์˜ Amount of Say๋ฅผ ๋”ํ•˜๋ฉด Total Amount of Say๊ฐ€ ๋‚˜์˜จ๋‹ค.

์ด ๊ฒฝ์šฐ Heart Disease๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฒƒ์˜ Total Amount of Say๊ฐ€ 2.7๋กœ ๋” ํฌ๋‹ค.

๋”ฐ๋ผ์„œ ์ตœ์ข…์ ์œผ๋กœ Heart Disease๊ฐ€ ์žˆ๋‹ค๊ณ  ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

์ถœ์ฒ˜: StatQuest

๊ฐ stump๋งˆ๋‹ค ๋ถ„๋ฅ˜๋ฅผ ํ•ด์ฃผ์ง€๋งŒ stump ํ•˜๋‚˜์˜ ๋ถ„๋ฅ˜๋ ฅ์€ ๊ต‰์žฅํžˆ ์•ฝํ•˜๋‹ค. (weak learner)

ํ•˜์ง€๋งŒ ์—ฌ๋Ÿฌ stump์˜ ๊ฒฐ๊ณผ๋ฅผ ์ข…ํ•ฉํ•˜๋ฉด ๊ฐ•ํ•œ ํ•™์Šต๊ธฐ(strong learner)๊ฐ€ ๋œ๋‹ค.

๋˜ํ•œ, ๊ฐ stump๋งˆ๋‹ค Amount of Say๊ฐ€ ๋‹ค๋ฅด๋‹ค.

๊ฐ stump์˜ Amount of Say๋ฅผ ํ•ฉ์น˜๋ฉด Total Amount of Say๊ฐ€ ๋‚˜์˜ค๊ณ , ์ด๋ฅผ ํ†ตํ•ด ์ตœ์ข… ๋ถ„๋ฅ˜๋ฅผ ํ•ด์ฃผ๋Š” ๊ฒƒ์ด๋‹ค.

 

 

 

 

 

 


 

์–ด๋ ต๋‹ฅ !!!!!!!!!!!!

 

 

 

 

Comments