当前位置: 首页 > wzjs >正文

自动优化网站软件没有了免费网站整站模板下载

自动优化网站软件没有了,免费网站整站模板下载,移动端什么意思,wordpress po第二章: 机器学习与神经网络概述 第四部分:回归算法理论与实践 第一节:线性回归模型 内容:多重共线性、正则化方法(如Lasso和Ridge回归)。 一、线性回归基础回顾 线性回归是预测型建模的经典方法,假设因…

第二章: 机器学习与神经网络概述

第四部分:回归算法理论与实践

第一节:线性回归模型

内容:多重共线性、正则化方法(如Lasso和Ridge回归)。


一、线性回归基础回顾

线性回归是预测型建模的经典方法,假设因变量 y 与一组自变量 x_1, x_2, \dots, x_n 存在线性关系:

y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \dots + \beta_n x_n + \varepsilon

其中:

  • \beta_i 为待估系数

  • ε 为误差项

目标:最小化残差平方和(Ordinary Least Squares,OLS)

【第二章:机器学习与神经网络概述】04.回归算法理论与实践 -(1)线性回归模型-CSDN博客

【漫话机器学习系列】061.线性回归参数计算(Finding Linear Regression Parameters)-CSDN博客

【机器学习】机器学习的基本分类-监督学习-线性回归(Linear Regression)_线性回归在机器学习里要解决什么问题-CSDN博客


二、多重共线性问题(Multicollinearity)

当多个自变量之间存在高度线性相关性时,会导致:

  • 系数估计不稳定

  • 模型解释性降低

  • 预测性能变差

检测方法:
  • 相关系数矩阵

  • 方差膨胀因子(VIF):若 VIF > 10 通常视为强共线性


三、正则化方法:控制过拟合与共线性

为避免过拟合和共线性,可在损失函数中加入惩罚项,常见方法如下:


1. 岭回归(Ridge Regression)

在 OLS 的基础上加入 L2 正则项:

\text{Loss} = \sum_{i=1}^n (y_i - \hat{y}_i)^2 + \lambda \sum_{j=1}^p \beta_j^2

  • λ:正则化强度(超参数)

  • L2正则会压缩系数,但不会变为零

from sklearn.linear_model import Ridge
ridge = Ridge(alpha=1.0)
ridge.fit(X_train, y_train)

【漫话机器学习系列】154.岭回归(Ridge Regression)-CSDN博客

【漫话机器学习系列】082.岭回归(或脊回归)中的α值(alpha in ridge regression)_岭回归的alpha参数-CSDN博客

【机器学习】机器学习的基本分类-监督学习-岭回归(Ridge Regression)_岭回归闭式解-CSDN博客


2. Lasso 回归(Lasso Regression)

在 OLS 中加入 L1 正则项:

\text{Loss} = \sum_{i=1}^n (y_i - \hat{y}_i)^2 + \lambda \sum_{j=1}^p |\beta_j|

  • L1正则具有稀疏性,可将部分系数压为 0,实现特征选择

from sklearn.linear_model import Lasso
lasso = Lasso(alpha=0.1)
lasso.fit(X_train, y_train)

 【机器学习】机器学习的基本分类-监督学习-Lasso 回归(Least Absolute Shrinkage and Selection Operator)_lasso回归 机器学习-CSDN博客

【漫话机器学习系列】101.特征选择法之Lasso(Lasso For Feature Selection)_lasso特征选择-CSDN博客


3. 弹性网(Elastic Net)

结合 L1 与 L2 正则的优点:

\text{Loss} = \sum (y - \hat{y})^2 + \lambda_1 \sum |\beta_j| + \lambda_2 \sum \beta_j^2

适合特征多且部分相关的情况。

from sklearn.linear_model import ElasticNet
enet = ElasticNet(alpha=0.1, l1_ratio=0.5)
enet.fit(X_train, y_train)

【漫话机器学习系列】046.弹性网络(Elastic Net)-CSDN博客 


四、线性回归与正则化方法对比

项目普通线性回归岭回归(Ridge)Lasso 回归弹性网
正则方式L2L1L1 + L2
抑制共线性⚠️ 部分有效
特征选择能力
稀疏性⚠️ 视参数而定
代码
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression, Ridge, Lasso
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import make_pipeline
from sklearn.model_selection import train_test_split# 1. 构造非线性数据(sin曲线 + 噪声)
np.random.seed(0)
X = np.sort(np.random.rand(40))
y = np.sin(2 * np.pi * X) + np.random.randn(40) * 0.1
X = X.reshape(-1, 1)# 2. 拆分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)# 3. 定义三种回归模型:普通线性回归、Ridge、Lasso
degree = 10  # 多项式回归阶数
models = {"Linear Regression": make_pipeline(PolynomialFeatures(degree), LinearRegression()),"Ridge (alpha=1)": make_pipeline(PolynomialFeatures(degree), Ridge(alpha=1)),"Lasso (alpha=0.01)": make_pipeline(PolynomialFeatures(degree), Lasso(alpha=0.01, max_iter=10000))
}# 4. 可视化
plt.figure(figsize=(10, 6))
x_plot = np.linspace(0, 1, 100).reshape(-1, 1)# 5. 拟合并绘图
for name, model in models.items():model.fit(X_train, y_train)y_plot = model.predict(x_plot)plt.plot(x_plot, y_plot, label=name)# 6. 原始数据点
plt.scatter(X, y, color="black", label="Data", s=20)plt.rcParams['font.sans-serif'] = ['SimHei']
# 解决负号'-'显示为方块的问题
plt.rcParams['axes.unicode_minus'] = Falseplt.title("模型拟合曲线图:普通线性回归 vs 正则化方法")
plt.xlabel("X")
plt.ylabel("y")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()
图示

上图展示了模型拟合效果的对比

  • 普通线性回归(Linear Regression)在高阶多项式下容易产生过拟合,曲线剧烈波动。

  • Ridge回归(L2正则化)在保留部分复杂度的同时抑制了系数过大,使得模型更平滑。

  • Lasso回归(L1正则化)在压缩部分特征系数为0的同时提升了模型的稀疏性,有助于特征选择。

该图直观说明了正则化在控制过拟合方面的优势。


五、Python 示例与模型评估

from sklearn.model_selection import cross_val_score, train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.linear_model import Ridge, Lasso, ElasticNet
from sklearn.datasets import make_regression# 生成模拟回归数据
X, y = make_regression(n_samples=1000, n_features=10, noise=0.1, random_state=42)# 划分训练集和测试集(此处仅用训练集做演示)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 初始化和训练Ridge模型
ridge = Ridge(alpha=1.0)
ridge.fit(X_train, y_train)# 初始化和训练Lasso模型
lasso = Lasso(alpha=0.1)
lasso.fit(X_train, y_train)# 初始化和训练ElasticNet模型
enet = ElasticNet(alpha=0.1, l1_ratio=0.5)
enet.fit(X_train, y_train)# 比较模型交叉验证分数
for model in [ridge, lasso, enet]:scores = cross_val_score(model, X_train, y_train, cv=5, scoring='neg_mean_squared_error')print(f"{model.__class__.__name__} 平均MSE: {-scores.mean():.4f}")
 运行结果
Ridge 平均MSE: 0.0587
Lasso 平均MSE: 0.1149
ElasticNet 平均MSE: 46.9568


文章转载自:

http://JIGvDkNU.whcLz.cn
http://mwMoFW11.whcLz.cn
http://zMoYXVUb.whcLz.cn
http://COIM2Tex.whcLz.cn
http://bO0n9FtQ.whcLz.cn
http://bCTi9DEg.whcLz.cn
http://RCripay7.whcLz.cn
http://LhFsj9aY.whcLz.cn
http://EA90AgKB.whcLz.cn
http://7g6Zr7zR.whcLz.cn
http://iFD5OCjp.whcLz.cn
http://saKco47G.whcLz.cn
http://XHiM3pQ4.whcLz.cn
http://MJnFffQo.whcLz.cn
http://i7z0t3VD.whcLz.cn
http://Y4g9LZC1.whcLz.cn
http://udEewdjS.whcLz.cn
http://RLH4UhXJ.whcLz.cn
http://KYlYPKw4.whcLz.cn
http://IRotnLvN.whcLz.cn
http://bhElSXhH.whcLz.cn
http://GDqhtYv8.whcLz.cn
http://uuJ5sPnu.whcLz.cn
http://PZsZD5qD.whcLz.cn
http://v9Xmnta1.whcLz.cn
http://i8EMOBgy.whcLz.cn
http://C2pnRNqg.whcLz.cn
http://t8UGJSNt.whcLz.cn
http://QSKKpssU.whcLz.cn
http://Gr2SZiWt.whcLz.cn
http://www.dtcms.com/wzjs/725623.html

相关文章:

  • 网站制作成本包含xyz域名免费注册
  • 阳泉网站建设网站新乡企业网站建设公司
  • 农村自建房设计网站电子商务网站建设策划书 服装 有详细数据库设计
  • 可以在公司局域网做网站吗中国建设银行手机版网站首页
  • 网站怎么写国外做ppt网站
  • 网站建设跟推广评价指标有什么关系福田网站建设seo信科
  • net网站开发学习男做基视频网站
  • 济南专业制作网站以网站建设专业画一幅画
  • 建设婚恋网站用什么搭建展台展览
  • 用html5做的网站长春市建设工程造价管理协会网站
  • 建个人网站做导购专做农产品跨境的网站有
  • dede无法更新网站主页到辽宁模板网站建设公司
  • 制作一个网站难吗wordpress全站静态页面
  • 网站建设规划结构网站建设 部署与发布
  • 网站建设图文家里笔记本做网站 怎么解析
  • 做网站需要会语言吗投票制作网站
  • 网站服务器搭建建设银行理财网站
  • 有趣的网站 知乎韶关市建设与房地产信息网站
  • 排版设计素材搜索引擎优化的核心及内容
  • 珠海网站建设熊掌号宁波网站建设最好的是哪家
  • 用tp框架怎么做网站东西湖网站建设
  • WordPress插件降级sem优化师底薪一般多少
  • 做直播网站要什么证吗安装字体到wordpress
  • 怎么做网站排名无锡网站建设无锡网络推广
  • 十堰做网站最好的公司泰州公司网站建设
  • 网站建设与管理实训报告wordpress翻页按钮颜色
  • 判断网站首页wordpress网页设计步骤
  • 四川哪家网站做的最好口碑营销案例简短
  • 软文发稿网站软文广告经典案例800字
  • 美食网站的建设论文深圳市宝安区西乡街道邮政编码