数据挖掘-欠拟合与过拟合

数据挖掘-欠拟合与过拟合

Spike Zhang

以MATLAB 模拟离散点

以下为欠拟合与过拟合图示:

欠拟合

模型没有很好地捕捉到数据特征,不能够很好地拟合数据。

解决方法

  1. 添加其他特征项,有时候我们模型出现欠拟合的时候是因为特征项不够导致的,可以添加其他特征项来很好地解决。
  2. 添加多项式特征,这个在机器学习算法里面用的很普遍,例如将线性模型通过添加二次项或者三次项使模型泛化能力更强。
  3. 减少正则化参数,正则化的目的是用来防止过拟合的,但是现在模型出现了欠拟合,则需要减少正则化参数。

过拟合

模型数据学习过于彻底,噪声数据特征也学习了,后期测试无法很好地识别数据,不能正确的分类,模型泛化能力太差。

解决方法

  1. 重新清洗数据,导致过拟合的一个原因也有可能是数据不纯导致的,如果出现了过拟合就需要我们重新清洗数据。

  2. 增大数据的训练量,还有一个原因就是我们用于训练的数据量太小导致的,训练数据占总数据的比例过小。

  • 标题: 数据挖掘-欠拟合与过拟合
  • 作者: Spike Zhang
  • 创建于 : 2017-03-08 22:10:14
  • 更新于 : 2024-07-13 09:46:17
  • 链接: https://chaosbynn.github.io/2017/03/08/数据挖掘-欠拟合与过拟合/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论
目录
数据挖掘-欠拟合与过拟合