当前位置: 首页 > news >正文

云服务器2008做网站wordpress用thinkphp

云服务器2008做网站,wordpress用thinkphp,网站制作费用及后期运营,建设工程报建备案网站学习笔记(28):随机噪声的原理、作用及代码实现详解 一、什么是随机噪声?为什么需要添加? 在机器学习中,随机噪声是指数据中无法用特征解释的随机波动,通常符合某种概率分布(如正态分布)。在房价模拟中添加…

学习笔记(28):随机噪声的原理、作用及代码实现详解

一、什么是随机噪声?为什么需要添加?

在机器学习中,随机噪声是指数据中无法用特征解释的随机波动,通常符合某种概率分布(如正态分布)。在房价模拟中添加噪声的核心原因如下:

1. 模拟真实世界的不确定性
  • 真实房价除了受面积、房龄影响,还受装修情况、学区、交通、政策等未被建模的特征影响,这些因素的综合效应可抽象为 “噪声”。
  • 示例:两套面积和房龄相同的房子,房价可能因装修风格、楼层等差异而不同,这些差异就是噪声的体现。
2. 防止模型过拟合
  • 若数据完全符合确定性公式(如 y = 5000x1 + 1000x2),模型可能会学习到 “虚假规律”(如将噪声当作必然关系)。
  • 添加噪声后,模型需要学习更鲁棒的模式,避免过度依赖训练数据中的特定样本。
二、代码中的噪声实现:np.random.randn(n_samples) * 10000

y = 5000 * X[:, 0] + 1000 * X[:, 1] + np.random.randn(n_samples) * 10000

1. 噪声的数学表达
  • np.random.randn(n_samples):生成服从标准正态分布(均值 0,标准差 1)的随机数数组。
  • * 10000:将噪声的标准差放大 10000 倍,使噪声范围与房价量级匹配(如房价在几十万到几百万,噪声范围约为 ±30000)。
2. 噪声的统计特性
  • 均值np.random.randn(...) 的均值为 0,因此噪声不会对房价的整体趋势产生偏移。
  • 标准差:10000,意味着约 68% 的噪声值落在 [-10000, 10000] 区间,约 95% 落在 [-20000, 20000] 区间。
3. 噪声对房价的影响示例

假设某房子面积 100 平方米,房龄 10 年:

  • 无噪声时房价:5000×100 + 1000×10 = 510000 元。
  • 有噪声时房价:510000 + 噪声,其中噪声可能是 +15000(房价 525000)或 -8000(房价 502000)等随机值。
三、噪声分布的选择:为什么用正态分布?

常见的噪声分布包括:

  1. 正态分布(高斯噪声):最常用,适用于多种自然现象(中心极限定理)。
  2. 均匀分布:噪声在固定区间内等概率出现(如 np.random.rand(...) * 20000 - 10000)。
  3. 拉普拉斯分布:噪声尾部更厚,极端值出现概率更高。

在房价场景中选择正态分布的原因:

  • 符合直觉:大多数未建模因素对房价的影响是微小的、随机的,正负影响概率相等,符合正态分布特征。
  • 数学性质好:正态分布的均值和方差独立,便于理论分析和模型推导。
四、噪声强度(标准差)的影响
  • 噪声强度小(如 *1000)
    房价数据点紧密围绕理论值分布,模型容易拟合,但可能过度依赖训练数据的细节(过拟合风险)。
  • 噪声强度大(如 *100000)
    房价数据点分散,模型难以学习到真实规律(欠拟合风险),但更接近真实场景的复杂性。
五、实战:可视化噪声对数据分布的影响
import numpy as np
import matplotlib.pyplot as plt# 生成基础数据(面积100,房龄10)
n_samples = 1000
area = 100 * np.ones(n_samples)
age = 10 * np.ones(n_samples)
base_price = 5000 * area + 1000 * age# 生成不同强度的噪声
noise_low = np.random.randn(n_samples) * 1000    # 低噪声
noise_medium = np.random.randn(n_samples) * 10000  # 中等噪声(代码中的设置)
noise_high = np.random.randn(n_samples) * 100000  # 高噪声# 计算带噪声的房价
price_low = base_price + noise_low
price_medium = base_price + noise_medium
price_high = base_price + noise_high# 可视化
plt.figure(figsize=(12, 4))plt.subplot(1, 3, 1)
plt.scatter(area, price_low, s=10, alpha=0.5)
plt.axhline(y=base_price[0], color='r', linestyle='--', label='理论价格')
plt.title('低噪声(σ=1000)')
plt.ylim(450000, 570000)plt.subplot(1, 3, 2)
plt.scatter(area, price_medium, s=10, alpha=0.5)
plt.axhline(y=base_price[0], color='r', linestyle='--')
plt.title('中等噪声(σ=10000)')
plt.ylim(450000, 570000)plt.subplot(1, 3, 3)
plt.scatter(area, price_high, s=10, alpha=0.5)
plt.axhline(y=base_price[0], color='r', linestyle='--')
plt.title('高噪声(σ=100000)')
plt.ylim(0, 1500000)plt.tight_layout()
plt.show()

可视化结果

  • 低噪声:数据点紧密围绕理论价格(510000),几乎成一条横线。
  • 中等噪声:数据点分散但仍可看出价格趋势,符合真实场景。
  • 高噪声:数据点极度分散,理论价格的指导意义被噪声淹没。
六、拓展:真实数据中的噪声处理

在实际机器学习项目中,噪声处理步骤包括:

  1. 数据清洗:识别并删除异常值(如房价为负数,可能是数据录入错误,而非噪声)。
  2. 特征工程:将部分噪声转化为可解释特征(如添加 “学区评分”“交通便利性” 等特征,减少未建模因素)。
  3. 模型选择:噪声强的场景可使用集成模型(如随机森林),通过多棵树的平均降低噪声影响。
总结:噪声的本质与价值

随机噪声并非 “无用的干扰”,而是真实世界复杂性的数学抽象。在房价预测中,它代表了:

  • 未被纳入模型的特征(如装修、学区);
  • 测量误差(如面积统计偏差);
  • 市场的随机波动(如政策突然调整)。

合理设置噪声强度,既能让模拟数据更贴近现实,又能帮助模型学习到真正的规律 —— 这正是机器学习从 “拟合数据” 到 “理解本质” 的关键一步。

http://www.dtcms.com/a/524209.html

相关文章:

  • 仓颉标准库std源码深度解析:构建全场景智能应用的基石
  • C4D域力场的应用之粒子随风飘散解析
  • 自己做的网站别人怎么访问安康网站建设公司电话
  • uniapp小程序实现手动向上滑动窗口
  • vue3:uniapp全局颜色变量配置思路:使用js变量
  • wordpress调用 别的网站昆明seo网站排名
  • 网站建设模板素材重庆互联网大厂
  • 网络爬虫指南:从原理到实战
  • 小杰-自然语言处理(four)——transformer系列——注意力机制
  • Java SpringAOP --- AOP的使用,AOP的源码
  • 阿里云渠道商:如何设置阿里云的安全组规则?
  • 网站设计速成如何让百度快速收录网站文章
  • 北京平台网站建设多少钱学院网站建设的特色
  • 外贸soho建站多少钱山东省住房和城乡建设厅官方网站
  • 芯科科技推出智能开发工具Simplicity Ecosystem软件开发套件开启物联网开发的新高度
  • 报错: lfstackPack redeclared in this block / go版本混乱,清理旧版本
  • 和鲸科技入选《大模型一体机产业图谱》,以一体机智驱科研、重塑教学
  • Go语言:关于怎么在线学习go语言的建议
  • 树 B树和B+树
  • 【arXiv2025】Real-Time Object Detection Meets DINOv3
  • 绍兴网站建设专业的公司4000-262-怎么在百度上发帖推广
  • AH2203输入12v输出3v 6v 9v/2A同步降压LED驱动器芯片
  • C如何调用Go
  • 使用Mathematica编写一个高效的Langevin方程求解器
  • 中国软件企业出海,为什么80%都选择这家服务商?
  • 《红黑树核心机制解析:C++ STL中map/set高效实现原理与工程实践》
  • Spring Boot 使用 Redis 实现消息队列
  • 从renderToString到hydrate,从0~1手写一个SSR框架
  • git报错no new changes、does not match any
  • 公司做网站的费用怎么做账望野作品