过拟合和欠拟合-创新互联

在机器学习寻找假设的过程中可能会出现过拟合和欠拟合的现象,那什么是过拟合和欠拟合呢?

创新互联建站从2013年开始,先为颍泉等服务建站,颍泉等地企业,进行企业商务咨询服务。为颍泉企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

  我们客观上认为,给定一个假设空间H,一个假设a∈H,如果存在其他的假设α∈H,使得在训练样例上a的错误率比α的小,但在整个实例分布上α的错误率比a的小,那么就说假设a过度拟合训练数据。

 一般而言,我们认为参数过多是造成过拟合的原因。其实,这只是过拟合的一种表现。有的时候参数过少也会造成过拟合,但这种情况出现极其少!举个例子,假设你在做分类任务,你的训练样例上只有两个(1、outlook=Rain,Wind=Weak、Temperature=Cool,Humidity=Normal,PalyTennis=Yes;2、outlook=Rain,Wind=Weak,Temperature=Cool,Humidity=Strong,PalyTennis=Yes;),我们依此做一个分类器。在两个训练样例的情形下,直接可以用特征Humidity进行分类,且很好的分类训练样例。但是稍微学过的机器学习的人都会觉得这样的分类器经不起推敲,这是因为参数太少了,出现了“黑天鹅”和“白天鹅”的现象。

 至于欠拟合则是因为所选参数太少无法刻画出训练样例的基本关系,或者是所选的参数不太好,不能反映问题所需。

(上述只是定性的介绍了欠拟合和过拟合,关于欠拟合和过拟合定量的介绍以及它们的解决办法将在以后介绍!)

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


当前文章:过拟合和欠拟合-创新互联
当前路径:http://ybzwz.com/article/hgiss.html