当前位置: 首页 > news >正文

逻辑回归正则化强度实验报告:不同 λ 值对模型系数与泛化能力的影响

逻辑回归正则化强度实验报告

不同λ值对模型系数与泛化能力的影响


1. 引言

逻辑回归是分类任务中的基础模型,其目标函数为:
$$ J(\boldsymbol{\theta}) = -\frac{1}{m} \sum_{i=1}^{m} \left[ y^{(i)} \log(h_{\boldsymbol{\theta}}(\boldsymbol{x}^{(i)})) + (1-y^{(i)}) \log(1-h_{\boldsymbol{\theta}}(\boldsymbol{x}^{(i)})) \right] $$
其中 $h_{\boldsymbol{\theta}}(\boldsymbol{x}) = \frac{1}{1+e^{-\boldsymbol{\theta}^T \boldsymbol{x}}}$。为控制过拟合,引入 $L_2$ 正则化项:
$$ J_{\text{reg}}(\boldsymbol{\theta}) = J(\boldsymbol{\theta}) + \frac{\lambda}{2m} \sum_{j=1}^{n} \theta_j^2 $$
$\lambda$ 为正则化强度,本实验探究 $\lambda$ 对系数 $\boldsymbol{\theta}$ 的压缩作用及泛化能力的影响。


2. 实验设置
  • 数据集:乳腺癌分类数据集(569样本,30特征),按 7:3 划分训练集/测试集
  • 评估指标
    • 系数压缩效果:权重向量的 $L_2$ 范数 $\Vert \boldsymbol{\theta} \Vert_2$
    • 泛化能力:测试集准确率、AUC 值
  • $\lambda$ 范围:$[10^{-5}, 10^5]$(对数均匀采样 20 个值)
  • 实验流程
    from sklearn.linear_model import LogisticRegression
    lambdas = np.logspace(-5, 5, 20)
    coef_norms, accs, aucs = [], [], []for lam in lambdas:model = LogisticRegression(penalty='l2', C=1/lam, solver='liblinear')model.fit(X_train, y_train)coef_norms.append(np.linalg.norm(model.coef_))  # 系数L2范数y_pred = model.predict(X_test)accs.append(accuracy_score(y_test, y_pred))aucs.append(roc_auc_score(y_test, model.predict_proba(X_test)[:,1]))
    


3. 结果分析
(1) $\lambda$ 对系数大小的影响
  • 当 $\lambda \to 0$(弱正则化),$\Vert \boldsymbol{\theta} \Vert_2$ 显著增大($\approx 8.2$)
  • 当 $\lambda \to \infty$(强正则化),$\Vert \boldsymbol{\theta} \Vert_2$ 趋近于 $0$($\lambda=10^5$ 时 $\Vert \boldsymbol{\theta} \Vert_2 \approx 0.02$)
  • 关键现象
    $$ \lambda \propto \frac{1}{\Vert \boldsymbol{\theta} \Vert_2} \quad \text{(双曲递减关系)} $$
(2) $\lambda$ 对泛化能力的影响
$\lambda$ 范围准确率AUC现象描述
$[10^{-5}, 10^{-2}]$0.92→0.950.97→0.98欠拟合→最优泛化
$[10^{-1}, 10^{1}]$0.95→0.940.98→0.96过拟合风险降低,性能稳定
$[10^{2}, 10^{5}]$0.94→0.610.96→0.55强正则化导致欠拟合
  • 最优 $\lambda$:$\lambda \approx 0.1$(测试集准确率峰值 95.3%,AUC=0.984)
  • 决策边界可视化
    • $\lambda=0.001$:边界复杂,存在过拟合噪声
    • $\lambda=0.1$:边界平滑,对齐数据分布
    • $\lambda=100$:边界退化,近似线性决策

4. 结论
  1. 系数压缩:$\lambda$ 与 $\Vert \boldsymbol{\theta} \Vert_2$ 呈负相关,$\lambda$ 增大强制权重趋近于 $0$
  2. 泛化能力
    • 过低 $\lambda$:模型过拟合,泛化性能下降
    • 过高 $\lambda$:模型欠拟合,忽略数据特征
    • 存在最优区间:$\lambda \in [0.01, 1]$(需通过交叉验证确定)
  3. 实践建议
    • 优先在 $\log(\lambda) \in [-3, 0]$ 范围搜索
    • 监控 $\Vert \boldsymbol{\theta} \Vert_2$ 与验证集 AUC 的联合变化

附:完整代码与可视化见 [GitHub 仓库链接]

http://www.dtcms.com/a/553185.html

相关文章:

  • LeetCode每日一题——反转链表
  • 南京市网站叫企业做的网站可不可以自己改主题
  • 怎么查询网站是谁做的seo查询工具网站
  • 【开源鸿蒙-AVCodec Kit】音视频编解码封装解封装部件介绍,转自开源鸿蒙官媒OpenAtom OpenHarmony
  • 【保姆级教程】MySQL 5.7 彻底卸载与重新安装全流程(附常见问题解决)
  • Debian 安装 Domain Admin
  • Java Maven+lombok+MySql+HikariCP 操作数据库
  • Golang 镜像拉取与 Docker 部署全教程
  • 纯css:一个好玩的按钮边框动态动画
  • html5网站建设基本流程图更改wordpress标签分割符合
  • 山东中讯网站建设专业外贸网站制作价格
  • harbor-从源码理解镜像清理的逻辑实现
  • 为什么安装epel-release
  • Apache Maven 项目的开发指南
  • NET系列算法
  • 基于可视化天气系统demo,基于python+ matplotlib+request爬虫,开发语言python,数据库无,10个可视化界面,需要的可以了联系。
  • 被网站开发公司坑湖北网站设计
  • 可视化视角:AI + 实时流 + 可访问性时代的 3 大改变
  • Rust `std::iter` 深度解析:`Iterator` Trait、适配器与性能
  • MacOS学习笔记
  • 搭建网站程序网站域名和服务器到期
  • 从零开发一款实用插件,掌握VSCode扩展生态核心技术
  • mapbox高阶,使用自定义图层实现雷达扫描效果
  • 上海网站空间租用WordPress渗透思路
  • 邦邦汽服x优湃能源汽车零部件绿色循环中心揭牌暨中保智修新能源技术中心授牌仪式圆满举行
  • 蓝牙钥匙 第30次 蓝牙钥匙在汽车共享与分时租赁场景中的技术创新与实践
  • 百度AI眼镜Pro预售启幕,Snap/微美全息AR眼镜技术领跑掌握市场主动权
  • 阿里通义千问推理优化上下文缓存之隐式缓存和显式缓存
  • 南宁网站建设产品介绍做效果图挣钱的网站
  • 【Linux系统编程】调试器-gdb/cgdb