๊ด€๋ฆฌ ๋ฉ”๋‰ด

yeon's ๐Ÿ‘ฉ๐Ÿป‍๐Ÿ’ป

๋ฒ ์ด์ฆˆ ์ถ”์ • (Bayesian Estimation) ๋ณธ๋ฌธ

Computer ๐Ÿ’ป/Machine Learning

๋ฒ ์ด์ฆˆ ์ถ”์ • (Bayesian Estimation)

yeon42 2021. 11. 5. 17:14
728x90

https://bkshin.tistory.com/entry/dd?category=1042793 

 

DATA - 10. ๋ฒ ์ด์ฆˆ ์ถ”์ •(Bayesian Estimation)

๊ธฐํ•˜ํ•™์— ํ”ผํƒ€๊ณ ๋ผ์Šค ์ •๋ฆฌ๊ฐ€ ์žˆ๋‹ค๋ฉด ํ™•๋ฅ ๋ก ์—๋Š” ๋ฒ ์ด์ฆˆ ์ •๋ฆฌ๊ฐ€ ์žˆ๋‹ค. - ํ•ด๋Ÿด๋“œ ์ œํ”„๋ฆฌ์Šค ๊ฒฝ ํ•ด๋Ÿด๋“œ ์ œํ”„๋ฆฌ์Šค ๊ฒฝ์ด ๋งํ•œ ๊ฒƒ์ฒ˜๋Ÿผ ๋ฒ ์ด์ฆˆ ์ •๋ฆฌ๋Š” ์ธ๊ณต์ง€๋Šฅ๊ณผ ํ†ต๊ณ„ํ•™์— ์ง€๋Œ€ํ•œ ์˜ํ–ฅ์„ ๋ผ์นœ ์ค‘์š”ํ•œ

bkshin.tistory.com

์œ„ ๋ธ”๋กœ๊ทธ๋ฅผ ํ•„์‚ฌํ•˜๋ฉฐ ๊ณต๋ถ€

 

* ๋ชจ๋“  ํ…์ŠคํŠธ์™€ ์ด๋ฏธ์ง€์˜ ์ถœ์ฒ˜๋Š” ์œ„ ๋ธ”๋กœ๊ทธ์ž…๋‹ˆ๋‹ค.

 


 

๋ฒ ์ด์ฆˆ ์ถ”์ •

 

ex) ํ˜‘๋ ฅ์—…์ฒด๋กœ๋ถ€ํ„ฐ ๋‚ฉํ’ˆ๋ฐ›์€ ๊ธฐ๊ณ„์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž.

- ๊ทธ๋Ÿฌ๊ธฐ ์œ„ํ•ด์„  ๋‚ฉํ’ˆ๋ฐ›์€ ๋ช‡ ๊ฐœ์˜ ๋ถ€ํ’ˆ์„ ๋ฌด์ž‘์œ„๋กœ ๋ฝ‘์•„ ์ด ํ‘œ๋ณธ์—์„œ ์–ป์–ด์ง„ ์ •๋ณด๋งŒ์œผ๋กœ ๋ชจ์ˆ˜(ํ˜‘๋ ฅ์—…์ฒด๋กœ๋ถ€ํ„ฐ ๋‚ฉํ’ˆ๋ฐ›์€ ๊ธฐ๊ณ„ ์ „์ฒด)์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•ด์•ผ ํ•œ๋‹ค

- But, ๊ณผ๊ฑฐ ๋‚ฉํ’ˆ ์‹œ ์„ฑ๋Šฅ๊ฒ€์‚ฌ๊ธฐ๋ก์ด๋‚˜ ๋น„์Šทํ•œ ๋ถ€ํ’ˆ์˜ ์„ฑ๋Šฅ ์ž๋ฃŒ, ์ด ๋ถ€ํ’ˆ์˜ ๋ฌผ๋ฆฌ์ ํŠน์„ฑ์— ๊ด€ํ•œ ์ง€์‹ ๋“ฑ์„ ํ†ตํ•ด ์ด ๋ถ€ํ’ˆ์˜ ์‚ฌ์ „ ์ •๋ณด๋ฅผ ์–ป์„ ์ˆ˜๋„ ์žˆ๋‹ค.

- ์ด๋Ÿฐ ๊ฒฝ์šฐ ๋‹จ์ˆœํžˆ ํ‘œ๋ณธ์„ ํ†ตํ•ด ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๊ธฐ๋ณด๋‹ค๋Š” ํ‘œ๋ณธ ์ •๋ณด์™€ ์‚ฌ์ „ ์ •๋ณด๋ฅผ ํ•จ๊ป˜ ์‚ฌ์šฉํ•ด ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๋Š” ๊ฒƒ์ด ๋ณด๋‹ค ๋ฐ”๋žŒ์ง

 

- ์ด์ฒ˜๋Ÿผ ์ถ”๋ก  ๋Œ€์ƒ์˜ ์‚ฌ์ „ ํ™•๋ฅ ๊ณผ ์ถ”๊ฐ€์ ์ธ ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•ด๋‹น ๋Œ€์ƒ์˜ ์‚ฌํ›„ ํ™•๋ฅ ์„ ์ถ”๋ก ํ•˜๋Š” ํ†ต๊ณ„์  ๋ฐฉ๋ฒ•์„ ๋ฒ ์ด์ฆˆ ์ถ”์ •(Bayesian Estimation)์ด๋ผ ํ•œ๋‹ค.

 

 

 

* ๋ฒ ์ด์ฆˆ ์ถ”์ •์˜ ๊ณ„์‚ฐ๋ฒ•

์ถœ์ฒ˜: ์œ„ ๋ธ”๋กœ๊ทธ

 

ex) ์–ด๋–ค ๋งˆ์„์˜ ์ „์ฒด ์‚ฌ๋žŒ๋“ค์˜ 10.5%๊ฐ€ ์•” ํ™˜์ž๊ณ , 89.5%๊ฐ€ ์•” ํ™˜์ž๊ฐ€ ์•„๋‹ˆ๋‹ค.

- ์ด ๋งˆ์„์˜ ๋ชจ๋“  ์‚ฌ๋žŒ์— ๋Œ€ํ•ด ์•” ๊ฒ€์ง„์„ ์‹ค์‹œํ–ˆ๋‹ค๊ณ  ํ•˜์ž. -> ์–‘์„ฑ/์Œ์„ฑ ํŒ์ • ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ์Œ

- but ๊ฒ€์ง„์ด 100% ์ •ํ™•ํ•˜์ง„ ์•Š๊ณ  ์•ฝ๊ฐ„์˜ ์˜ค์ฐจ ์กด์žฌํ•  ๊ฒƒ

- ์•” ํ™˜์ž ์ค‘ ์–‘์„ฑ ํŒ์ •์„ ๋ฐ›์€ 90.5%, ์Œ์„ฑ ํŒ์ •์„ ๋ฐ›์€ 9.5%, 

   ์•” ํ™˜์ž๊ฐ€ ์•„๋‹Œ ์‚ฌ๋žŒ ์ค‘ ์–‘์„ฑ ํŒ์ •์„ ๋ฐ›์€ 20.4%, ์Œ์„ฑ ํŒ์ •์„ ๋ฐ›์€ 79.5%

 

Q. ์–ด๋–ค ์‚ฌ๋žŒ์ด ์–‘์„ฑ ํŒ์ •์„ ๋ฐ›์•˜์„ ๋•Œ ์ด ์‚ฌ๋žŒ์ด ์•” ํ™˜์ž์ผ ํ™•๋ฅ ์€?

 

C(Cancer, ์•”ํ™˜์ž), P(Positive, ์–‘์„ฑ), N(Negative, ์Œ์„ฑ)

P(C) = 0.105

P(~C) = 0.895

P(P|C) = 0.905 (๋ฏผ๊ฐ๋„, sensitivity)

P(N|C) = 0.095

P(P|~C) = 0.204

P(N|~C) = 0.795 (ํŠน์ด๋„, specificity)

 

์ด ๋•Œ ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๋‹ต์€ P(C|P); ์–ด๋–ค ์‚ฌ๋žŒ์ด ์–‘์„ฑ ํŒ์ •์„ ๋ฐ›์•˜์„ ๋•Œ ์ด ์‚ฌ๋žŒ์ด ์•” ํ™˜์ž์ผ ํ™•๋ฅ 

 

๋ฒ ์ด์ฆˆ์˜ ์ถ”์ •์— ์˜ํ•ด

P(C|P) = P(P|C)*P(C) / P(P)

 

์—ฌ๊ธฐ์„œ P(P) = P(P, C) + P(P, ~C) = P(P|C)*P(C) + P(P|~C)*P(~C)

 

๋”ฐ๋ผ์„œ P(C|P) = 0.905*0.105 / (0.905*1.105 + 0.204*0.895) = 0.342

 

๋งˆ์ฐฌ๊ฐ€์ง€๋กœ P(~C|P), P(C|N), P(~C|N)๋„ ๊ตฌํ•ด๋ณด๋ฉด ๊ฐ๊ฐ 0.65797, 0.013808, 0.986192์ด๋‹ค.

 

 

 

 

 

 

 

 

 

 

 

Comments