当前位置: 首页 > news >正文

逻辑回归正则化解释性实验报告:L2 正则对模型系数收缩的可视化分析

逻辑回归正则化解释性实验报告

L2 正则化对模型系数的影响

L2 正则化(Ridge 正则化)通过在损失函数中增加系数的平方和惩罚项,约束模型复杂度,防止过拟合。其目标函数为:

[ J(\theta) = -\frac{1}{m} \sum_{i=1}^m [y^{(i)} \log(h_\theta(x^{(i)})) + (1-y^{(i)}) \log(1-h_\theta(x^{(i)}))] + \frac{\lambda}{2m} \sum_{j=1}^n \theta_j^2 ]

其中 $\lambda$ 是正则化强度参数,$\theta_j$ 为模型系数。

实验设计与可视化方法

固定其他超参数(如学习率、迭代次数),逐步增大 $\lambda$ 值(例如从 0.01 到 100),记录每次训练后模型系数的绝对值。

使用 Python 的 sklearn.linear_model.LogisticRegression 实现,设置 penalty='l2',并通过 coef_ 属性提取系数。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression# 模拟数据
X = np.random.randn(100, 5)
y = np.random.randint(0, 2, 100)# 不同 lambda 值(C=1/lambda)
lambdas = np.logspace(-2, 2, 20)
coefs = []
for l in lambdas:model = LogisticRegression(penalty='l2', C=1/l, solver='liblinear')model.fit(X, y)coefs.append(np.abs(model.coef_[0]))# 可视化
plt.figure(figsize=(10, 6))
for i in range(5):plt.plot(lambdas, [c[i] for c in coefs], label=f'Feature {i+1}')
plt.xscale('log')
plt.xlabel('Lambda (Regularization Strength)')
plt.ylabel('Absolute Coefficient Value')
plt.title('L2 Regularization Effect on Logistic Regression Coefficients')
plt.legend()
plt.grid(True)
plt.show()

典型可视化结果分析
  • 低 $\lambda$ 值(弱正则化):系数接近无正则化时的原始值,模型可能过拟合。
  • 中等 $\lambda$ 值:系数被均匀压缩,但保留相对重要性排序。
  • 高 $\lambda$ 值(强正则化):所有系数趋近于零,模型趋向欠拟合。
关键结论
  1. L2 正则化会平滑地减小所有系数的绝对值,但通常不会将任何系数压缩至零。
  2. 特征重要性排序在适度正则化下保持稳定,适用于需要保留所有特征的场景。
  3. 最优 $\lambda$ 需通过交叉验证确定,平衡偏差与方差。
http://www.dtcms.com/a/553656.html

相关文章:

  • LeetCode 412 - Fizz Buzz
  • 大型门户网站建设特点怎么知道一个网站是谁做的
  • IDC报告:阿里云市场份额升至26.8%,连续5季度上涨
  • 佛山房地产网站建设51建模网官方网站
  • 字格格子模板合集:多样练字格硬笔书法训练模板(可打印)
  • Arduino ESP32-C3 串口使用注意事项
  • MCP是什么及如何开发一个MCPServer
  • 程序逆向分析
  • 卷绕设备与叠片设备
  • 个人可以做购物网站吗西安曲江文化园区建设开发有限公司网站
  • 网站当前链接深圳坪地网站建设 自助建站 五合一建站平台
  • GD32F407VE天空星开发板的ADC按键(ADKey)的实现
  • 使用 Nginx 轻松处理跨域请求(CORS)
  • 2025 年世界职业院校技能大赛机电设备安装与运维赛道备赛
  • 网站备案帐号用织梦做模板网站
  • 我的第一份工作:996
  • 贵州网推传媒有限公司企业网站seo优
  • 矿泉水除溴化物的解决方案
  • Bugku-Web题目-cookies
  • C# 类的方法介绍
  • 打破数据孤岛:制造行业档案管理方案如何实现数据互通与协同?
  • 加强 廉政网站建设衍艺网站建设
  • 中企高呈建设网站律师在哪个网站做推广好
  • 昆山非标设计工厂6名SolidWorks设计师共享一台服务器
  • 未来之窗昭和仙君(四十八)开发商品进销存修仙版——东方仙盟筑基期
  • 佛山设计网站浙江省国有建设用地出让网站
  • 跨厂商(华为 H3C)防火墙 GRE 隧道部署
  • 抖音网站单产品网站
  • 品牌网站源码江阴响应式网站建设
  • Java中wait和await的区别