数据挖掘-K-Means

数据挖掘-K-Means

Spike Zhang

类内数据点越近越好,类间数据点越远越好。

属性 描述
优点 容易实现
缺点 可能收敛到局部最小值,在大规模数据集上收敛较慢
适用 数值型

输入:分类个数k,包含在n个数据对象的数据集

输出:k个聚类

步骤:

  1. 从n个数据对象中任意选取k个对象作为初始聚类中心
  2. 分别计算每个对象到各个聚类中心距离,把对象分配到距离最近的聚类中
  3. 所有对象分配后,重新计算k个聚类的中心
  4. 与前一次计算得到k个聚类中心比较,如果聚类中心发生变化,转步骤2,否则转步骤
  5. 得出结果

  • 标题: 数据挖掘-K-Means
  • 作者: Spike Zhang
  • 创建于 : 2017-03-21 22:02:41
  • 更新于 : 2024-07-13 09:46:17
  • 链接: https://chaosbynn.github.io/2017/03/21/数据挖掘-K-Means/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论
目录
数据挖掘-K-Means