当前位置: 首页 > news >正文

【实战】预警算法--噪声添加机制

1. 背景

在多变量自联想预测或异常检测场景中,我们常使用带噪自编码器(Denoising AutoEncoder,DAE)来训练模型,使模型能够从带噪输入中重构原始数据。噪声的添加方式对训练效果、稳定性以及模型用途有显著影响。

2. 两种噪声添加方式对比

2.1 等比例加噪声后标准化

实现方式

noise_factor = 0.05
X_noisy = X * (1 + np.random.uniform(-noise_factor, noise_factor, X.shape))
X_scaled = (X_noisy - X_noisy.mean()) / X_noisy.std(ddof=0)

特点

  • 噪声大小随原始数值幅度变化,保留原始比例波动。
  • 标准化后仍保留原始数据结构,但均值、方差会被噪声略微影响。

适用场景

  • 还原原始数据分布或记忆特征
  • 数据量纲差异不大或希望保留真实比例关系。
  • 当模型输入和输出都是原始 X 时,这是最合理的方式。

优点

  • 保留原始数值构成的比例信息。
  • 模型训练目标明确:重构原始 X。

缺点

  • 大幅波动变量可能导致噪声过大,需要适当控制 noise_factor

2.2 标准化后添加高斯噪声

实现方式

X_scaled = (X - X.mean()) / X.std(ddof=0)
X_noisy = X_scaled + np.random.normal(0, noise_factor, X_scaled.shape)

特点

  • 所有变量噪声幅度一致,可控。
  • 数据被统一到标准化空间,训练更稳定。
    适用场景
  • 目标是 增强模型鲁棒性,训练模型从噪声中恢复输入。
  • 数据量纲差异大,或者希望训练过程稳定,便于调参。
  • 不关注原始比例关系,只关注模型对扰动的泛化能力。

优点

  • 训练稳定,可控性强。
  • 易于统一设置噪声强度,调参方便。

缺点

  • 不保留原始数值比例,失去还原原始构成的特性。
  • 对“记忆原始数据特征”的目标不够直接。

3. 总结对比

特性等比例加噪声后标准化标准化后加噪声
噪声依赖原始数值幅度标准化空间均一
训练稳定性受大幅变量影响更稳定可控
是否保留原始比例
调参难度中等较低
适用目标拟合记忆矩阵,记录 X 构成增强模型鲁棒性,泛化能力

4. 结论

根据项目目标——重构原始数据、拟合记忆矩阵——推荐采用 “原始 X 加噪声后再标准化” 的方式。

  • 优点:保持数据比例关系,模型学习的是原始数据的构成特征,训练结果可直接反映 X 的分布。
  • 注意事项:
    • 控制噪声幅度,避免极端值过大影响训练。
    • 标准化仍必不可少,用于优化梯度更新和加快收敛。

文章转载自:

http://DSi6X1YG.xcyzy.cn
http://KFiNMXpF.xcyzy.cn
http://4knEQImX.xcyzy.cn
http://YkOfHdTp.xcyzy.cn
http://1nPmU6TC.xcyzy.cn
http://0d9Rlv3b.xcyzy.cn
http://R0pm0u4b.xcyzy.cn
http://oDTpB6IG.xcyzy.cn
http://6bY6cLhF.xcyzy.cn
http://E7InJi1V.xcyzy.cn
http://1EBsN5Cd.xcyzy.cn
http://grRgYszX.xcyzy.cn
http://kQhn4jaJ.xcyzy.cn
http://MDgsPaWI.xcyzy.cn
http://gF2pMt46.xcyzy.cn
http://nRqQ87vK.xcyzy.cn
http://fFZWeuvc.xcyzy.cn
http://s5gYd3Ci.xcyzy.cn
http://qzNfdir3.xcyzy.cn
http://1DifsDRm.xcyzy.cn
http://Eba9ZC1J.xcyzy.cn
http://We5RF9Rm.xcyzy.cn
http://GlUFNW1y.xcyzy.cn
http://xYadC0aE.xcyzy.cn
http://sUJLT7bA.xcyzy.cn
http://vCzHdbfP.xcyzy.cn
http://t7X02oFz.xcyzy.cn
http://X5ChYh0Q.xcyzy.cn
http://2I7vzknG.xcyzy.cn
http://49C8AqiM.xcyzy.cn
http://www.dtcms.com/a/386186.html

相关文章:

  • Three.js 中如何给 3D 模型添加文字标签?
  • 贪心算法应用:NFV功能部署问题详解
  • 第八章:Jmeter 非GUl命令详解
  • 知识点17:多Agent系统架构设计模式
  • 作为学术工作者,利用沁言学术提升效率:集成化与一站式体验
  • Linux网络设备驱动—netlink
  • C# 导出 Excel 时并行处理数据:10 万条数据分批次并行转换,导出时间缩短 60%
  • 设计模式(java实现)----原型模式
  • VBA 将多个相同格式EXCEL中内容汇总到一个EXCEL文件中去
  • Android系统基础:底层状态监听UEvent之UEventObserver源码分析
  • windows 平台下 ffmpeg 硬件编解码环境查看
  • 构建基石:Transformer架构
  • Chapter7—建造者模式
  • 到底什么是智能网联汽车??第二期——决策与控制
  • 将普通Wpf项目改成Prism项目
  • 微硕WINSOK高性能N沟道场效应管WSD3040DN56,助力汽车中控散热风扇静音长寿命
  • nextjs+shadcn+tailwindcss实现博客中的overview
  • cursor-关于自定义指令的问题处理
  • Vision Transformer (ViT) :Transformer在computer vision领域的应用(四)
  • 【开题答辩全过程】以 “今天吃什么”微信小程序为例,包含答辩的问题和答案
  • iOS App 内存泄漏与性能调优实战 如何排查内存问题、优化CPU与GPU性能、降低耗电并提升流畅度(uni-app iOS开发优化指南)
  • 从 Token 拦截器到 Web 配置
  • Next.js 的原理和它的使用场景
  • SPAR模型优化思路
  • pycharm+miniconda cursor+miniconda配置
  • windows在pycharm中为项目添加已有的conda环境
  • 微信小程序实现-单选-以及全选功能。
  • 知识点19:生产环境的安全与治理
  • 软件开源协议(Open Source License)介绍
  • SAP HANA Scale-out 04:缓存