数据挖掘-决策树

数据挖掘-决策树

Spike Zhang

决策树:从属性相同的一类别事例推理树状规则分类方法

属性 描述
优点 计算复杂度不高,输出易于理解,中间值缺失不敏感,可以处理不相关特征数据
缺点 可能产生过拟合
适用 数值型,标称型

步骤

  1. 生成决策树:关键=> 选择适合的属性作为判别依据
  2. 修剪决策树:生成决策树时未考虑的噪声影响,容易出现过拟合,预测效果差,预先剪枝,后剪枝
  3. 识别叶子节点:差异较大,为规则

ID3不足

  1. 无法回溯,不一定是全局最优解
  2. 信息增益,信息熵偏向属性取值较多的属性
  3. 仅处理离散,不能处理连续属性
  4. 样本过小或包含噪声时,容易过拟合(Overfitting)
  • 标题: 数据挖掘-决策树
  • 作者: Spike Zhang
  • 创建于 : 2017-03-05 23:34:05
  • 更新于 : 2024-07-13 09:46:17
  • 链接: https://chaosbynn.github.io/2017/03/05/数据挖掘-决策树/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论
目录
数据挖掘-决策树