R语言深度学习-3-过拟合问题（无监督正则化/Lasso回归/岭回归/集成和平均算法）

2024-03-15 1339阅读

温馨提示：这篇文章已超过378天没有更新，请注意相关的内容是否还可用！

本教程参考《RDeepLearningEssential》

我们从上一个教程看到，我们看到在我们训练迭代或者训练更大神经网络的时候，往往会产生过拟合，而且越来越严重，它可能会把训练它的数据拟合的很好，但是未必能把新数据做的很好。

因此本次介绍一下提升模型泛化能力而防止模型过拟合的方法，称为无监督正则化，通常训练是减少训练误差来优化模型，但是正则化是关注减少测试或训练误差，使得模型在新数据上的效果和训练数据上一样好。

3.1 L1罚函数

3.1.1 Lasso概念

L1罚函数，又称最小绝对值收缩和选择算子（Least Absolute Shrinkage and Selection Operator）是我们熟知的Lasso算法，基本思想是把权重向0收缩，最好淘汰一些不重要的系数，比如一个八元一次方程，描述多种生活习惯对寿命的影响，其中有一个每天刷牙应该属于被去掉的项。

除了防止过拟合之外，它还可以作为一种变量选择的方法。惩罚的力度是由一个超参数λ所控制的，它乘以权重绝对值的和，可以被预先设定，或者就像其他超参数那样，使用交叉验证或者一些类似的方法来优化。

首先，很明显惩罚的影响依赖于权重的大小，而权重的大小依赖于数据的规模。因此，我们通常先把数据标准化为带有单位方差(或者起码是每个变量的方差相等)的形式。

我们用 X 表示输入，Y 表示输出或者因变量，B 是参数，F 是为了求出 B 而要优化的目标函数。特别地有:F(B;X,Y)。在神经网络中，参数可以是偏差或者偏移(本质上是来自回归的截距)以及权重。L1 罚函数把目标函数修正为其中 w 仅代表权重(就是说，偏移通常是被忽略的)。考虑梯度，我们可以将这个增加的惩罚项表示为

$R语言深度学习-3-过拟合问题（无监督正则化/Lasso回归/岭回归/集成和平均算法）$

3.1.2 Lasso代码示例

我们通过一个模拟线性回归问题来看一下L1罚函数的工作原理：

我们创建一个具有特定均值和相关性的多元正态分布数据集X，然后根据这些数据和给定的线性模型参数生成了一个响应变量y。

library("glmnet")
library("MASS")
set.seed(1234)
X

VPS购买请点击我

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度，360，搜狗等多加搜索引擎自动关键词搜索配图，如有侵权的图片，请第一时间联系我们，邮箱：ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

R语言深度学习-3-过拟合问题（无监督正则化/Lasso回归/岭回归/集成和平均算法）

3.1 L1罚函数

3.1.1 Lasso概念

3.1.2 Lasso代码示例

相关阅读

怎么把织梦的模板替换?

dedecms怎么调用特定的栏目文档?

怎么抓包一个网页?

wap怎么封装app?

目录[+]