日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

瓦爾德法是什么聚類方法 聚類方法( 二 )


K-means通過選擇k個(gè)中心點(diǎn)來工作 。然后將這些均值用作其聚類的質(zhì)心:任何最接近給定均值的點(diǎn)都將分配給該均值的聚類 。
分配完所有點(diǎn)后,移動(dòng)每個(gè)群集并獲取其包含的所有點(diǎn)的平均值 。這個(gè)新的“平均”點(diǎn)是聚類的新均值 。
只需一遍又一遍地重復(fù)這兩個(gè)步驟,直到點(diǎn)分配停止變化!
一旦點(diǎn)分配停止改變,該算法就被認(rèn)為已經(jīng)收斂
我們現(xiàn)在將擁有k個(gè)不同的聚類,每個(gè)聚類的質(zhì)心更接近其cluster中的每個(gè)點(diǎn),而不是任何其他質(zhì)心 。再次計(jì)算質(zhì)心不會(huì)改變分配,所以停止 。這就是K-means的全部?jī)?nèi)容,但它是一種非常強(qiáng)大的方法,可以在考慮整個(gè)數(shù)據(jù)集時(shí)查找已知數(shù)量的聚類 。
有很多方法來初始化你的means 。Forgy方法從數(shù)據(jù)中隨機(jī)選擇k個(gè)隨機(jī)觀測(cè)值并將其作為起點(diǎn) 。Random Partition 方法將數(shù)據(jù)集中的每個(gè)點(diǎn)分配給隨機(jī)cluster,然后根據(jù)這些點(diǎn)計(jì)算質(zhì)心并恢復(fù)算法 。
雖然K-means是一個(gè)NP難問題,但是啟發(fā)式方法能夠在多項(xiàng)式時(shí)間內(nèi)找到對(duì)全局最優(yōu)的適當(dāng)近似,并且能夠有效地處理大數(shù)據(jù)集,使其在某些情況下成為分層聚類的可靠選擇 。
聚類是一個(gè)奇怪的世界,擁有更奇怪的技術(shù)集合 。這三種方法只是最流行的一些機(jī)器學(xué)習(xí)方法,但它們可以幫助您在機(jī)器學(xué)習(xí)數(shù)據(jù)中發(fā)現(xiàn)未知分組 。集群在探索性數(shù)據(jù)分析、為其他分析尋找初始化點(diǎn)方面非常有用,而且部署起來也非常簡(jiǎn)單 。明智地使用聚類可以為您的數(shù)據(jù)提供令人驚訝的見解 。
【瓦爾德法是什么聚類方法 聚類方法】(今完)

推薦閱讀