์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- cs231n
- ์๋ฒ ๋ฉ
- ์ ํ๋์ํ
- native
- ๋ฅ๋ฌ๋
- react
- Titanic
- ์๊ณ ๋ฆฌ์ฆ
- AI
- nlp
- ๋ฐ์ดํฐ์๊ฐํ
- ๋ถ์
- ์๋๋ก์ด๋์คํ๋์ค
- ๋ฆฌ์กํธ
- ํ์ดํ๋
- ๋ฐ์ดํฐ๋ถ์
- ๊นํ
- c++
- Git
- ๋ฐ์ดํฐ
- ๋์
- ๋จธ์ ๋ฌ๋
- ๋ค์ดํฐ๋ธ
- Kaggle
- ๋ฐฑ์ค
- ์ํ์ฝ๋ฉ
- ๊ฒฐ์ ํธ๋ฆฌ
- ์ธํ๋ฐ
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- linearalgebra
- Today
- Total
yeon's ๐ฉ๐ป๐ป
๋ฒ ์ด์ฆ ์ถ์ (Bayesian Estimation) ๋ณธ๋ฌธ
https://bkshin.tistory.com/entry/dd?category=1042793
DATA - 10. ๋ฒ ์ด์ฆ ์ถ์ (Bayesian Estimation)
๊ธฐํํ์ ํผํ๊ณ ๋ผ์ค ์ ๋ฆฌ๊ฐ ์๋ค๋ฉด ํ๋ฅ ๋ก ์๋ ๋ฒ ์ด์ฆ ์ ๋ฆฌ๊ฐ ์๋ค. - ํด๋ด๋ ์ ํ๋ฆฌ์ค ๊ฒฝ ํด๋ด๋ ์ ํ๋ฆฌ์ค ๊ฒฝ์ด ๋งํ ๊ฒ์ฒ๋ผ ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ ์ธ๊ณต์ง๋ฅ๊ณผ ํต๊ณํ์ ์ง๋ํ ์ํฅ์ ๋ผ์น ์ค์ํ
bkshin.tistory.com
์ ๋ธ๋ก๊ทธ๋ฅผ ํ์ฌํ๋ฉฐ ๊ณต๋ถ
* ๋ชจ๋ ํ ์คํธ์ ์ด๋ฏธ์ง์ ์ถ์ฒ๋ ์ ๋ธ๋ก๊ทธ์ ๋๋ค.
๋ฒ ์ด์ฆ ์ถ์
ex) ํ๋ ฅ์ ์ฒด๋ก๋ถํฐ ๋ฉํ๋ฐ์ ๊ธฐ๊ณ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ค๊ณ ๊ฐ์ ํ์.
- ๊ทธ๋ฌ๊ธฐ ์ํด์ ๋ฉํ๋ฐ์ ๋ช ๊ฐ์ ๋ถํ์ ๋ฌด์์๋ก ๋ฝ์ ์ด ํ๋ณธ์์ ์ป์ด์ง ์ ๋ณด๋ง์ผ๋ก ๋ชจ์(ํ๋ ฅ์ ์ฒด๋ก๋ถํฐ ๋ฉํ๋ฐ์ ๊ธฐ๊ณ ์ ์ฒด)์ ์ฑ๋ฅ์ ํ๊ฐํด์ผ ํ๋ค
- But, ๊ณผ๊ฑฐ ๋ฉํ ์ ์ฑ๋ฅ๊ฒ์ฌ๊ธฐ๋ก์ด๋ ๋น์ทํ ๋ถํ์ ์ฑ๋ฅ ์๋ฃ, ์ด ๋ถํ์ ๋ฌผ๋ฆฌ์ ํน์ฑ์ ๊ดํ ์ง์ ๋ฑ์ ํตํด ์ด ๋ถํ์ ์ฌ์ ์ ๋ณด๋ฅผ ์ป์ ์๋ ์๋ค.
- ์ด๋ฐ ๊ฒฝ์ฐ ๋จ์ํ ํ๋ณธ์ ํตํด ๋ชจ์๋ฅผ ์ถ์ ํ๊ธฐ๋ณด๋ค๋ ํ๋ณธ ์ ๋ณด์ ์ฌ์ ์ ๋ณด๋ฅผ ํจ๊ป ์ฌ์ฉํด ๋ชจ์๋ฅผ ์ถ์ ํ๋ ๊ฒ์ด ๋ณด๋ค ๋ฐ๋์ง
- ์ด์ฒ๋ผ ์ถ๋ก ๋์์ ์ฌ์ ํ๋ฅ ๊ณผ ์ถ๊ฐ์ ์ธ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํด๋น ๋์์ ์ฌํ ํ๋ฅ ์ ์ถ๋ก ํ๋ ํต๊ณ์ ๋ฐฉ๋ฒ์ ๋ฒ ์ด์ฆ ์ถ์ (Bayesian Estimation)์ด๋ผ ํ๋ค.
* ๋ฒ ์ด์ฆ ์ถ์ ์ ๊ณ์ฐ๋ฒ
ex) ์ด๋ค ๋ง์์ ์ ์ฒด ์ฌ๋๋ค์ 10.5%๊ฐ ์ ํ์๊ณ , 89.5%๊ฐ ์ ํ์๊ฐ ์๋๋ค.
- ์ด ๋ง์์ ๋ชจ๋ ์ฌ๋์ ๋ํด ์ ๊ฒ์ง์ ์ค์ํ๋ค๊ณ ํ์. -> ์์ฑ/์์ฑ ํ์ ๊ฒฐ๊ณผ๊ฐ ๋์ฌ ์ ์์
- but ๊ฒ์ง์ด 100% ์ ํํ์ง ์๊ณ ์ฝ๊ฐ์ ์ค์ฐจ ์กด์ฌํ ๊ฒ
- ์ ํ์ ์ค ์์ฑ ํ์ ์ ๋ฐ์ 90.5%, ์์ฑ ํ์ ์ ๋ฐ์ 9.5%,
์ ํ์๊ฐ ์๋ ์ฌ๋ ์ค ์์ฑ ํ์ ์ ๋ฐ์ 20.4%, ์์ฑ ํ์ ์ ๋ฐ์ 79.5%
Q. ์ด๋ค ์ฌ๋์ด ์์ฑ ํ์ ์ ๋ฐ์์ ๋ ์ด ์ฌ๋์ด ์ ํ์์ผ ํ๋ฅ ์?
C(Cancer, ์ํ์), P(Positive, ์์ฑ), N(Negative, ์์ฑ)
P(C) = 0.105
P(~C) = 0.895
P(P|C) = 0.905 (๋ฏผ๊ฐ๋, sensitivity)
P(N|C) = 0.095
P(P|~C) = 0.204
P(N|~C) = 0.795 (ํน์ด๋, specificity)
์ด ๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๋ต์ P(C|P); ์ด๋ค ์ฌ๋์ด ์์ฑ ํ์ ์ ๋ฐ์์ ๋ ์ด ์ฌ๋์ด ์ ํ์์ผ ํ๋ฅ
๋ฒ ์ด์ฆ์ ์ถ์ ์ ์ํด
P(C|P) = P(P|C)*P(C) / P(P)
์ฌ๊ธฐ์ P(P) = P(P, C) + P(P, ~C) = P(P|C)*P(C) + P(P|~C)*P(~C)
๋ฐ๋ผ์ P(C|P) = 0.905*0.105 / (0.905*1.105 + 0.204*0.895) = 0.342
๋ง์ฐฌ๊ฐ์ง๋ก P(~C|P), P(C|N), P(~C|N)๋ ๊ตฌํด๋ณด๋ฉด ๊ฐ๊ฐ 0.65797, 0.013808, 0.986192์ด๋ค.
'Computer ๐ป > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์์ด๋ค ๋ถ์คํธ (AdaBoost) (0) | 2021.11.07 |
---|---|
๋์ด๋ธ ๋ฒ ์ด์ฆ (Naive Bayes Classification) (0) | 2021.11.05 |
์์ ๋ค์ ๊ธฐ๋ ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree) ๋ค์ ์ ๋ฆฌํ๊ธฐ ํธํธ (0) | 2021.11.03 |
์์๋ธ ๋ชจ๋ธ (0) | 2021.11.03 |
๋ถํธ์คํธ๋ฉ(Bootstrap) (0) | 2021.11.03 |