C均值算法是聚类分析中最简单的算法,算法主要步骤如下:
(1)如已知分类数为k,选取k个样本点为初始聚类中心,记为z1(l),z2(l),……zk(l),迭代序号l=1;
(2)使用最近邻规则将所有样本分配到各聚类中心所代表的k类ωj(k)中,各类所包含的样本数为Nj(l);
(3)计算各类的重心(均值向量),并令该重心为新的聚类中心,即:
因为在该步中要计算k个聚类中的样本均值,故称作k均值算法。
(4)如zj(l+1)≠zj(l),表示尚未得到最佳聚类结果,则返回步骤(2),继续迭代计算。