11.1算法原理

来自CloudWiki

跳转至：导航，搜索

k-均值算法把簇的形心定义为簇内点的均值。

它的处理流程如下：

1.在数据点集D中随机的选择k个对象（这个k表示你要讲数据集分成几个簇），每个对象代表一个簇的初始均值或中心。

2.对剩下的每个对象，根据其与哥哥簇中心的欧氏距离，将它分配到最相似的簇。

3.k-均值算法迭代的改善内变差。对于每个簇，它使用上次迭代分配到该簇的对象，计算新的均值。

4.使用更新的均值作为新的簇中心。重新分配所有对象。

5.迭代继续，直到分配稳定，本轮行程的簇的中心点坐标与前一轮行程的簇相同。

取自“http://www.openbrains.net/mediawiki/index.php?title=11.1算法原理&oldid=7620”