当前位置: 首页 > wzjs >正文

国外教育网站模板做一个网站最低多少钱

国外教育网站模板,做一个网站最低多少钱,python一句做网站,泰安网络营销公司NumPy-统计函数详解一、基础统计函数:均值、方差、标准差1. 全局统计:忽略维度的整体计算2. 按轴统计:指定维度方向的计算二、位置统计:中位数、分位数、百分位数1. 中位数计算2. 分位数与百分位数三、离散程度:极差、…

NumPy-统计函数详解

    • 一、基础统计函数:均值、方差、标准差
      • 1. 全局统计:忽略维度的整体计算
      • 2. 按轴统计:指定维度方向的计算
    • 二、位置统计:中位数、分位数、百分位数
      • 1. 中位数计算
      • 2. 分位数与百分位数
    • 三、离散程度:极差、四分位距、变异系数
      • 1. 极差(Range)
      • 2. 四分位距(IQR)
      • 3. 变异系数(Coefficient of Variation)
    • 四、相关分析:协方差与相关系数
      • 1. 协方差矩阵
      • 2. 相关系数矩阵
    • 五、高级应用:加权统计与掩码处理
      • 1. 加权统计
      • 2. 掩码数组:处理缺失值
    • 六、性能优化与注意事项
      • 1. 内存高效的分块计算
      • 2. 统计函数的精度问题
    • 七、实战案例:数据分布分析
      • 1. 数据标准化
      • 2. 异常值检测
      • 3. 数据分布可视化(配合matplotlib)

统计函数是提取数据特征、洞察数据分布的核心工具,NumPy作为Python数值计算的基石,提供了丰富的统计函数库,涵盖均值、方差、中位数、相关系数等多种统计指标。

一、基础统计函数:均值、方差、标准差

1. 全局统计:忽略维度的整体计算

import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6]])print(np.mean(arr))      # 均值:3.5
print(np.var(arr))       # 方差:2.9166666666666665
print(np.std(arr))       # 标准差:1.707825127659933
print(np.sum(arr))       # 总和:21
print(np.min(arr))       # 最小值:1
print(np.max(arr))       # 最大值:6

2. 按轴统计:指定维度方向的计算

通过axis参数指定统计方向:

  • axis=0:按列方向(跨行统计)
  • axis=1:按行方向(跨列统计)
print(np.mean(arr, axis=0))  # 按列求均值:[2.5 3.5 4.5]
print(np.mean(arr, axis=1))  # 按行求均值:[2. 5.]
print(np.sum(arr, axis=1))   # 按行求和:[ 6 15]

二、位置统计:中位数、分位数、百分位数

1. 中位数计算

中位数是将数据分为上下两部分的数值,对异常值不敏感:

data = np.array([1, 3, 2, 4, 5])
print(np.median(data))  # 输出:3.0(排序后中间的数)# 偶数个元素时取中间两个数的平均值
data = np.array([1, 2, 3, 4])
print(np.median(data))  # 输出:2.5((2+3)/2)

2. 分位数与百分位数

  • 分位数:将数据分为k等份的数值(如四分位数k=4)
  • 百分位数:分位数的特殊情况(k=100)
data = np.array([1, 2, 3, 4, 5])
print(np.percentile(data, 25))  # 第25百分位数:2.0
print(np.percentile(data, 50))  # 第50百分位数(中位数):3.0
print(np.percentile(data, 75))  # 第75百分位数:4.0

三、离散程度:极差、四分位距、变异系数

1. 极差(Range)

最大值与最小值的差值:

data = np.array([1, 3, 2, 4, 5])
print(np.ptp(data))  # 输出:4(5-1)

2. 四分位距(IQR)

第75百分位数与第25百分位数的差值,衡量数据中间50%的离散程度:

q75, q25 = np.percentile(data, [75, 25])
print(q75 - q25)  # 输出:2.0(4-2)

3. 变异系数(Coefficient of Variation)

标准差与均值的比值,用于比较不同数据集的相对离散程度:

def coefficient_of_variation(x):return np.std(x) / np.mean(x)data = np.array([1, 2, 3, 4, 5])
print(coefficient_of_variation(data))  # 输出:0.5270462766947299

四、相关分析:协方差与相关系数

1. 协方差矩阵

衡量两个变量的总体误差,反映变量间的线性关系方向:

x = np.array([1, 2, 3])
y = np.array([4, 5, 6])
print(np.cov(x, y))
# 输出:
# [[ 1.  1.]
#  [ 1.  1.]]
# 对角线为各自的方差,非对角线为协方差

2. 相关系数矩阵

将协方差标准化到[-1,1]区间,更直观地反映相关性强度:

print(np.corrcoef(x, y))
# 输出:
# [[1. 1.]
#  [1. 1.]]
# 完全正相关(相关系数为1)

五、高级应用:加权统计与掩码处理

1. 加权统计

对不同数据点赋予不同权重,计算加权均值、方差等:

data = np.array([1, 2, 3])
weights = np.array([0.1, 0.3, 0.6])
print(np.average(data, weights=weights))  # 加权均值:2.5

2. 掩码数组:处理缺失值

使用np.ma模块创建掩码数组,忽略特定值进行统计:

data = np.array([1, np.nan, 3])
masked_data = np.ma.masked_invalid(data)  # 屏蔽NaN值
print(np.ma.mean(masked_data))  # 输出:2.0(忽略NaN后计算均值)

六、性能优化与注意事项

1. 内存高效的分块计算

处理超大规模数据时,可使用np.nanmean等函数自动处理NaN值,并通过out参数指定输出数组:

# 假设data是一个非常大的数组
result = np.empty(shape=data.shape[1:])
np.mean(data, axis=0, out=result)  # 直接将结果写入预分配内存

2. 统计函数的精度问题

不同数据类型可能导致统计结果精度差异:

arr_float = np.array([1.1, 2.2, 3.3], dtype=np.float64)
arr_float32 = arr_float.astype(np.float32)print(np.sum(arr_float))   # 输出:6.6(高精度)
print(np.sum(arr_float32)) # 输出:6.600000381469727(低精度)

七、实战案例:数据分布分析

1. 数据标准化

将数据转换为均值为0、标准差为1的标准正态分布:

data = np.array([1, 2, 3, 4, 5])
standardized = (data - np.mean(data)) / np.std(data)
print(standardized)  # 输出:[-1.26491106 -0.63245553  0.          0.63245553  1.26491106]

2. 异常值检测

使用四分位距识别异常值:

q1, q3 = np.percentile(data, [25, 75])
iqr = q3 - q1
lower_bound = q1 - 1.5 * iqr
upper_bound = q3 + 1.5 * iqr
outliers = data[(data < lower_bound) | (data > upper_bound)]
print(outliers)  # 输出异常值

3. 数据分布可视化(配合matplotlib)

import matplotlib.pyplot as plt
data = np.random.normal(0, 1, 1000)  # 生成正态分布数据
plt.hist(data, bins=30)
plt.axvline(np.mean(data), color='r', linestyle='dashed', linewidth=2)  # 均值线
plt.axvline(np.median(data), color='g', linestyle='dashed', linewidth=2)  # 中位数线
plt.show()

总结:NumPy统计函数的核心优势:

  1. 高效性:底层用C实现,避免Python循环,处理大规模数据时性能优异
  2. 灵活性:通过axis参数支持多维数组的任意方向统计
  3. 鲁棒性:内置对NaN、Inf等特殊值的处理机制

That’s all, thanks for reading~~
觉得有用就点个赞、收进收藏夹吧!关注我,获取更多干货~


文章转载自:

http://WUB87Tfu.pjbhk.cn
http://N3noogNj.pjbhk.cn
http://nHmwNwrO.pjbhk.cn
http://2woKxAR0.pjbhk.cn
http://eYfLfdXb.pjbhk.cn
http://DTpmhn4m.pjbhk.cn
http://bCuVv0fZ.pjbhk.cn
http://mMypRsf0.pjbhk.cn
http://JtZZPddM.pjbhk.cn
http://WhJHAjMs.pjbhk.cn
http://GkODA92J.pjbhk.cn
http://E6WQb9Wj.pjbhk.cn
http://oaNFSvZW.pjbhk.cn
http://r4xiZVVG.pjbhk.cn
http://40XE8FpT.pjbhk.cn
http://dioqxJmS.pjbhk.cn
http://cQe1wJVl.pjbhk.cn
http://wJzi20Tu.pjbhk.cn
http://uc8UdAlT.pjbhk.cn
http://km0FQrPl.pjbhk.cn
http://ZjpR6Lwv.pjbhk.cn
http://g0RkL9KC.pjbhk.cn
http://oO3ihRNZ.pjbhk.cn
http://HlLSLwCa.pjbhk.cn
http://UnLLGDeO.pjbhk.cn
http://JZlws1h1.pjbhk.cn
http://r3ZrNB1D.pjbhk.cn
http://4QaYal5c.pjbhk.cn
http://R5YiAAkI.pjbhk.cn
http://dLA6NMXF.pjbhk.cn
http://www.dtcms.com/wzjs/693763.html

相关文章:

  • 哪个网站做课件ppt比较好网站建设预付款
  • 校园网站建设详细的设计方案聊城网站制作价格
  • seo网站规划图片在线编辑网站
  • 腾讯云怎样做网站企业网站建设的报价
  • 网站开发能申请软件著作权吗小猪会飞网站建设
  • 网站优化排名易下拉效率洛阳网红打卡地
  • 台州做网站的电话学建设网站及功能
  • 网站专题页面wordpress4.9.3漏洞
  • 加强单位网站建设短视频引流推广软件
  • 旅游网站建设公司哪家好网站里的轮廓图 怎么做的
  • 网站建设推广特色上海优化排名网站
  • hulu网站在中国做内容吗wordpress描述引用
  • 网站建设公司muyunke网站建设画册设计
  • 网站建设的注意网站 建设 深圳
  • 个人备案可以做影视网站吗wordpress页面图片插件
  • 自己创建网站众筹网站建设费用
  • 免费发布广告的网站nginx 网站开发
  • 有自己的网站怎么做淘宝客腾讯邮箱企业邮箱入口登录
  • 做电影网站需要哪些证重庆网站建设优化
  • 衡水做wap网站图片制作用什么软件
  • pc 网站建设工业设计 做自己的网站 知乎
  • php 设置网站根目录wordpress主题 新闻
  • 网站开发的成本沈阳网站建设联系方式
  • 建筑公司网站应该则么做智慧团建网站登陆
  • 网站建设课程报告论文网站搭建公司排行
  • 企业网站运营推广难做吗快影
  • 检测网站打开速度wordpress 3.7
  • 餐饮公司 网站建设中国建筑协会官网
  • 广州建设教育网站少儿戏曲知识 网站建设
  • 揭阳网站建设策划方案免费网站转app