์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- ๋ค์ดํฐ๋ธ
- ์ํ์ฝ๋ฉ
- ํ์ดํ๋
- ๋จธ์ ๋ฌ๋
- ๋ฐ์ดํฐ
- Git
- ์๊ณ ๋ฆฌ์ฆ
- react
- ์ ํ๋์ํ
- Kaggle
- ๊ฒฐ์ ํธ๋ฆฌ
- Titanic
- ๋ฐ์ดํฐ์๊ฐํ
- ๋ฆฌ์กํธ
- ์ธํ๋ฐ
- ์๋ฒ ๋ฉ
- cs231n
- ๋ฐฑ์ค
- ๋ฅ๋ฌ๋
- ๋ฐ์ดํฐ๋ถ์
- native
- ๋์
- ๋ถ์
- linearalgebra
- AI
- nlp
- ๊นํ
- ์๋๋ก์ด๋์คํ๋์ค
- c++
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- Today
- Total
yeon's ๐ฉ๐ป๐ป
K-means Clustering (K-ํ๊ท ํด๋ฌ์คํฐ๋ง) ๋ณธ๋ฌธ
K-means Clustering (K-ํ๊ท ํด๋ฌ์คํฐ๋ง)
yeon42 2021. 11. 9. 21:19๋จธ์ ๋ฌ๋ - 7. K-ํ๊ท ํด๋ฌ์คํฐ๋ง(K-means Clustering)
K-means clustering์ ๋น์ง๋ ํ์ต์ ํด๋ฌ์คํฐ๋ง ๋ชจ๋ธ ์ค ํ๋์ ๋๋ค. ํด๋ฌ์คํฐ๋ ๋น์ทํ ํน์ฑ์ ๊ฐ์ง ๋ฐ์ดํฐ๋ผ๋ฆฌ์ ๋ฌถ์์ ๋๋ค. (A cluster refers to a collection of data points aggregated together because..
bkshin.tistory.com
์ ๋ธ๋ก๊ทธ๋ฅผ ํ์ฌํ๋ฉฐ ๊ณต๋ถ
* ๋ชจ๋ ํ ์คํธ์ ์ด๋ฏธ์ง์ ์ถ์ฒ๋ ์ ๋ธ๋ก๊ทธ์ ๋๋ค.
K-means clustering์ ๋น์ง๋ ํ์ต์ ํด๋ฌ์คํฐ๋ง ๋ชจ๋ธ ์ค ํ๋
ํด๋ฌ์คํฐ(cluster): ๋น์ทํ ํน์ฑ์ ์ง๋ ๋ฐ์ดํฐ๋ผ๋ฆฌ์ ๋ฌถ์
- ์ฌ๊ธฐ์์ ๋น์ทํ ํน์ฑ; ๊ฐ๊น์ด ์์น
ํด๋ฌ์คํฐ๋ง(clustering): ์ด๋ค ๋ฐ์ดํฐ๋ค์ด ์ฃผ์ด์ก์ ๋, ๊ทธ ๋ฐ์ดํฐ๋ค์ ํด๋ฌ์คํฐ๋ก ๊ทธ๋ฃนํ ์์ผ์ฃผ๋ ๊ฒ
centroid: ๊ฐ ํด๋ฌ์คํฐ์ ์ค์ฌ
K-means Clustering์์
- K: ํด๋ฌ์คํฐ์ ๊ฐฏ์
- means: ํ ํด๋ฌ์คํฐ ์์ ๋ฐ์ดํฐ ์ค์ฌ(centroid)
์ฆ, K-means Clustering์ K๊ฐ์ centroid๋ฅผ ๊ธฐ๋ฐ์ผ๋ก K๊ฐ์ ํด๋ฌ์คํฐ๋ฅผ ๋ง๋ค์ด์ฃผ๋ ๊ฒ์ ์๋ฏธ
- ๋ชฉ์ ; ์ ์ฌํ ๋ฐ์ดํฐ ํฌ์ธํธ๋ผ๋ฆฌ ๊ทธ๋ฃนํํ์ฌ ํจํด์ ์ฐพ์๋ด๋ ๊ฒ
ํ๋ก์ธ์ค
1. ์ผ๋ง๋ ๋ง์ ํด๋ฌ์คํฐ๊ฐ ํ์ํ์ง ๊ฒฐ์ (= K ๊ฒฐ์ )
2. ์ด๊ธฐ centroid ์ ํ
- ๋๋คํ๊ฒ
- ์๋์ผ๋ก
- Kmean++ ๋ฐฉ๋ฒ
3. ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ํํ๋ฉฐ ๊ฐ ๋ฐ์ดํฐ๋ง๋ค ๊ฐ์ฅ ๊ฐ๊น์ด centroid๊ฐ ์ํด์๋ ํด๋ฌ์คํฐ๋ก assign
4. centroid๋ฅผ ํด๋ฌ์คํฐ์ ์ค์ฌ์ผ๋ก ์ด๋
5. ํด๋ฌ์คํฐ์ assign๋๋ ๋ฐ์ดํฐ๊ฐ ์์ ๋๊น์ง ์คํ 3, 4๋ฅผ ๋ฐ๋ณต
K-means ๋จ์
* local minimum์ด ๋ฐ์ํ ์ ์๋ค!
- ์ ๋ฐ์ดํฐ๋ฅผ ๋ ๊ฐ์ ํด๋ฌ์คํฐ๋ก ๋๋๋ ค๋ฉด?
- ์ผ์ชฝ 6๊ฐ ๋ฐ์ดํฐ์ ๋ฌถ์ & ์ค๋ฅธ์ชฝ 6๊ฐ ๋ฐ์ดํฐ์ ๋ฌถ์์ ๊ฐ๊ฐ์ ํด๋ฌ์คํฐ๋ก ๋๋์ด ์ฃผ๊ธฐ
- ํ์ง๋ง ์ด๊ธฐ์ ์ค์ ๋ centroid๊ฐ ์์ ๊ฐ๋ค๋ฉด ์, ์๋๋ก ๋๋ ๊ฒ์
- ์์ชฝ 6๊ฐ์ ์ ์ ์์ชฝ centroid์ ๊ฐ์ฅ ๊ฐ๊น๊ณ , ์๋์ชฝ 6๊ฐ์ ์ ์ ์๋์ชฝ centroid์ ๊ฐ๊น๊ธฐ ๋๋ฌธ์ ์ด๋๋ก iteration์ด ๋๋จ
- ํ์ง๋ง centroid ์์น๋ฅผ ์ ์์ผ๋ก ์กฐ๊ธ๋ง ์์ง์ฌ๋ ํด๋ฌ์คํฐ๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๋๋ก ์ค๋ฅธ์ชฝ, ์ผ์ชฝ์ผ๋ก ๋ฐ๋ ๊ฒ
'Computer ๐ป > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Apriori algorithm (0) | 2021.11.19 |
---|---|
Frequent Patterns, Association Rules, Closed Pattern, Max Pattern (Data Mining) (0) | 2021.11.19 |
KNN (K-Nearest Neighbor) (0) | 2021.11.09 |
๊ทธ๋ผ๋์ธํธ ๋ถ์คํธ (Gradient Boost) (0) | 2021.11.07 |
์์ด๋ค ๋ถ์คํธ (AdaBoost) (0) | 2021.11.07 |