数据挖掘-决策树
决策树:从属性相同的一类别事例推理树状规则分类方法
属性 | 描述 |
---|---|
优点 | 计算复杂度不高,输出易于理解,中间值缺失不敏感,可以处理不相关特征数据 |
缺点 | 可能产生过拟合 |
适用 | 数值型,标称型 |
步骤
- 生成决策树:关键=> 选择适合的属性作为判别依据
- 修剪决策树:生成决策树时未考虑的噪声影响,容易出现过拟合,预测效果差,预先剪枝,后剪枝
- 识别叶子节点:差异较大,为规则
ID3不足
- 无法回溯,不一定是全局最优解
- 信息增益,信息熵偏向属性取值较多的属性
- 仅处理离散,不能处理连续属性
- 样本过小或包含噪声时,容易过拟合(Overfitting)
- 标题: 数据挖掘-决策树
- 作者: Spike Zhang
- 创建于 : 2017-03-05 23:34:05
- 更新于 : 2024-07-13 09:46:17
- 链接: https://chaosbynn.github.io/2017/03/05/数据挖掘-决策树/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论