k means means business
play

K-means: - PowerPoint PPT Presentation

K-means: Means Business Jus/n Talbot,Lei Hu K-means


  1. K-­‑means: ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Means ¡Business ¡ Jus/n ¡Talbot,Lei ¡Hu ¡

  2. K-­‑means ¡ • An ¡itera/ve ¡algorithm ¡for ¡clustering ¡ • An ¡approxima/on ¡to ¡finding ¡the ¡maximum ¡ likelihood ¡es/mates ¡for ¡the ¡means ¡of ¡the ¡ clusters ¡ • Aims ¡to ¡minimize ¡the ¡within ¡cluster ¡sum ¡of ¡ squares ¡error ¡ • No ¡ ¡Guarantee ¡of ¡the ¡global ¡op/mum ¡

  3. Algorithm ¡ • Pick ¡a ¡number ¡of ¡clusters ¡k, ¡and ¡the ¡central ¡ points ¡of ¡the ¡clusters ¡ • Assign ¡each ¡point ¡to ¡the ¡cluster ¡with ¡the ¡ closest ¡mean ¡ • Calculate ¡the ¡new ¡means ¡to ¡be ¡the ¡centroid ¡of ¡ the ¡points ¡in ¡the ¡cluster ¡ • Repeat ¡un/l ¡convergence ¡

  4. Example ¡ hMp://cs.joensuu.fi/sipu/ ¡ ¡

  5. K-­‑means++ ¡ (The ¡advantage ¡of ¡Careful ¡Seeding) ¡ • By ¡selec/ng ¡the ¡ini/al ¡centers ¡you ¡can ¡ guarantee ¡lower ¡total ¡error ¡ • ¡ ¡

  6. Algorithm ¡ • Choose ¡ini/al ¡center ¡c_1 ¡uniformly ¡at ¡random ¡ • Choose ¡the ¡next ¡center ¡c_i ¡by ¡seXng ¡c_i ¡= ¡to ¡a ¡ point ¡in ¡the ¡dataset ¡x’ ¡with ¡probability ¡ • D(x) ¡being ¡the ¡shortest ¡distance ¡from ¡a ¡data ¡ point ¡x ¡to ¡the ¡closest ¡center ¡already ¡chosen ¡

  7. Fuzzy ¡k-­‑means ¡clustering ¡

  8. Probability ¡of ¡cluster ¡membership ¡

  9. Cost ¡func/on ¡

  10. Minimiza/on ¡of ¡cost ¡func/on ¡

  11. Solu/on ¡

  12. Algorithm ¡

  13. Example ¡

  14. References ¡ ¡ ¡ ¡ ¡Duda, ¡R., ¡Hart, ¡P., ¡and ¡Stork, ¡D. ¡(2001). ¡ ¡ ¡ ¡ ¡PaMern ¡Classica/on. ¡ ¡ ¡ ¡ ¡John ¡Wiley ¡and ¡Sons, ¡2nd ¡edi/on. ¡ ¡ ¡ ¡ ¡Sergios ¡T., ¡Konstan/nos ¡K.(2006) ¡ ¡ ¡ ¡ ¡PaMern ¡Recogni/on. ¡ ¡ ¡ ¡ ¡Elsevier ¡3rd ¡Edi/on. ¡ ¡ ¡ ¡ ¡Arthur ¡D., ¡Vassilvitski ¡S. ¡(2007) ¡ ¡ ¡ ¡ ¡k-­‑means++: ¡the ¡advantages ¡of ¡careful ¡seeding ¡ ¡ ¡ ¡ ¡Proceedings ¡18 th ¡Annual ¡ACM-­‑SIAM ¡Symposium ¡on ¡Discrete ¡Algorithms ¡

  15. Ques/ons ¡

Recommend


More recommend