当前位置：首页 > wzjs >正文

衡水移动端网站建设百度人工服务热线

wzjs 2025/8/11 2:30:48

衡水移动端网站建设,百度人工服务热线,新手做网站做什么样的,网站建设服务公司专业服务学习笔记(36):用概率密度方式来了解：正态分布拟合曲线一、用概率密度方式来了解：正态分布拟合曲线用 “货架和水” 的例子，逐行拆解这段代码的逻辑，保证你能秒懂～先明确代码要做什么这段代码在画一条 “理论上的房价分…

学习笔记(36):用概率密度方式来了解：正态分布拟合曲线

一、用概率密度方式来了解：正态分布拟合曲线

用 “货架和水” 的例子，逐行拆解这段代码的逻辑，保证你能秒懂～

先明确代码要做什么

这段代码在画一条 “理论上的房价分布曲线”（假设房价符合正态分布），并让这条曲线和实际数据的直方图对齐。关键是理解公式 stats.norm.pdf(x, mu, sigma) * len(data) * (x.max() - x.min())/100 的含义。

用 “货架和水” 类比代码中的变量

假设我们有 1000 套房子（总样本量），房价范围是 100-600 万。我们想画一条正态分布曲线，看看 “理论上” 房价应该怎么分布。这就像：

总样本量 len(data) → 货架上总共有 200 瓶水（前面例子）。
房价范围 x → 货架总长度 10 米（0-10 米）。
正态分布的概率密度 stats.norm.pdf(x, mu, sigma) → 货架上每米的 “水占比密度”（比如 A 区每米占总水量的 15%，即 0.15 概率 / 米）。

逐行拆解代码

# 1. 拟合正态分布参数（类比：计算货架上的平均水量和波动）
mu, sigma = stats.norm.fit(data[price_col])# 2. 生成100个均匀分布的房价点（覆盖整个房价范围）
# 类比：把10米货架分成100个小区间，每个区间宽0.1米
x = np.linspace(data[price_col].min(), data[price_col].max(), 100)# 3. 绘制正态分布曲线（重点！）
plt.plot(x, stats.norm.pdf(x, mu, sigma) * len(data) * (x.max() - x.min()) / 100,'r--', linewidth=2, label=f'正态分布拟合: μ={mu:.2f}, σ={sigma:.2f}')

核心公式解析：`stats.norm.pdf(x, mu, sigma) * len(data) * (x.max() - x.min()) / 100`

这个公式其实是三部分的乘积，对应到 “货架和水” 的例子：

stats.norm.pdf(x, mu, sigma)
→ 这是正态分布的概率密度函数，表示 “在房价为 x 时的理论密度”（单位：概率 / 万元）。
→ 类比货架：A 区每米的 “水占比密度” 是 0.15 概率 / 米（即每米占总水量的 15%）。
len(data)
→ 总样本量（比如 1000 套房子），用于把 “概率” 转化为 “实际数量”。
→ 类比货架：总水量 200 瓶，15% 的占比对应 200×15%=30 瓶。
(x.max() - x.min()) / 100
→ 这是区间宽度！
→ x 是从房价最小值到最大值的 100 个点，所以相邻两点的距离 = (600 万 - 100 万)/100 = 5 万（每个区间宽 5 万）。
→ 类比货架：把 10 米分成 100 段，每段宽 0.1 米。