当前位置: 首页 > wzjs >正文

做网站网站的给宝宝做衣服网站好

做网站网站的,给宝宝做衣服网站好,京东官方网上商城,关键词优化前言 在机器学习或者深度学习课题里,时常要频繁地使用统计概率的理论来辅助进行数据处理与研究。因此,理解和掌握一定的统计概率知识是非常必要的。在科学研究和城市研究领域,统计概率理论的应用也十分常见。为了理好的理解概率分布&#xf…

前言

在机器学习或者深度学习课题里,时常要频繁地使用统计概率的理论来辅助进行数据处理与研究。因此,理解和掌握一定的统计概率知识是非常必要的。在科学研究和城市研究领域,统计概率理论的应用也十分常见。为了理好的理解概率分布,先看看以下的相关概念:

  • 随机变量 (Random Variable):一个随机变量是一个可以取多个可能值的量,这些值是根据某种概率分布来确定的。
  • 密度函数 (Density Functions):在连续随机变量中,密度函数描述了随机变量的可能取值范围内每个值出现的概率密度。它通常用于计算概率、期望值等。
  • 伯努利分布 (Bernoulli Distribution):一种离散概率分布,描述了一个随机变量只有两种可能取值(通常表示为0和1)的情况,比如抛硬币的结果。
  • 二项式分布 (Binomial Distribution):用于描述在一系列独立重复试验中成功次数的概率分布,每次试验只有两个可能的结果,且成功概率相同。
  • 均匀分布 (Uniform Distribution):在一定范围内每个可能的值具有相同的概率分布,没有明显的偏向。
  • 泊松分布 (Poisson Distribution):用于描述在固定时间或空间内随机事件发生次数的概率分布,常用于描述稀有事件。
  • 正态分布 (Normal Distribution):又称为高斯分布,是一种连续分布,其在统计学中极为常见,通常呈钟形曲线,对称分布。
  • 长尾分布 (Long-Tailed Distribution):指概率分布的尾部(较大或较小的值)相对较长的分布,表示存在极端值的可能性较大。
  • 学生 t 检验分布 (Student’s t-test Distribution):用于小样本情况下统计推断的分布,主要用于比较两组数据的均值是否有显著差异。
  • 对数正态分布 (Lognormal Distribution):一种连续分布,其对数服从正态分布,常用于描述正值数据,如财务数据、股票收益等。
  • 指数分布 (Exponential Distribution):用于描述连续时间内等待随机事件发生的时间间隔的概率分布,常用于描述时间间隔、寿命等。
  • 威布尔分布 (Weibull Distribution):一种连续分布,常用于描述时间到达、寿命等,具有灵活的形状,可以适应不同类型的数据。
  • 伽马分布 (Gamma Distribution):一种连续分布,广泛用于描述正值随机变量的分布,也可用于描述等待时间、寿命等。
  • 卡方分布 (Chi-square Distribution):用于统计推断中的分布,通常用于检验观察值与期望值之间的拟合度。
  • 中心极限定理 (Central Limit Theorem):该定理表明,当从任何分布中抽取大量独立随机变量并计算它们的平均值时,这些平均值的分布将近似于正态分布,不受原始分布的影响

高斯分布

高斯分布可能是最常听到也熟悉的分布。它有几个名字:有人称它为钟形曲线,因为它的概率图看起来像一个钟形,有人称它为高斯分布,因为首先描述它的德国数学家卡尔·高斯命名,还有一些人称它为正态分布,因为早期的统计学家 注意到它一遍又一遍地再次发生。正态分布的概率密度函数如下:σ 是标准偏差,μ 是分布的平均值。要注意的是,在正态分布中,均值、众数和中位数都是相等的。当我们绘制正态分布的随机变量时,曲线围绕均值对称——一半的值在中心的左侧,一半在中心的右侧。并且,曲线下的总面积为 1。

mu = 0 
variance = 1 
sigma = np.sqrt(variance) 
x = np.linspace(mu - 3*sigma, mu + 3*sigma, 100) plt.subplots(figsize=(8, 5)) 
plt.plot(x, stats.norm.pdf(x, mu, sigma)) 
plt.title("Normal Distribution") 
plt.show()

对于正态分布来说。经验规则告诉我们数据的百分比落在平均值的一定数量的标准偏差内。这些百分比是:

  • 68% 的数据落在平均值的一个标准差内。
  • 95% 的数据落在平均值的两个标准差内。
  • 99.7% 的数据落在平均值的三个标准差范围内。​

对数正态分布

对数正态分布是对数呈正态分布的随机变量的连续概率分布。因此,如果随机变量 X 是对数正态分布的,则 Y = ln(X) 具有正态分布。这是对数正态分布的 PDF:对数正态分布的随机变量只取正实数值。因此,对数正态分布会创建右偏曲线。让我们在 Python 中绘制它:

X = np.linspace(0, 6, 500) std = 1 
mean = 0 
lognorm_distribution = stats.lognorm([std], loc=mean) 
lognorm_distribution_pdf = lognorm_distribution.pdf(X) fig, ax = plt.subplots(figsize=(8, 5)) 
plt.plot(X, lognorm_distribution_pdf, label="μ=0, σ=1") 
ax.set_xticks(np.arange(min(X), max(X))) std = 0.5 
mean = 0 
lognorm_distribution = stats.lognorm([std], loc=mean) 
lognorm_distribution_pdf = lognorm_distribution.pdf(X) 
plt.plot(X, lognorm_distribution_pdf, label="μ=0, σ=0.5") std = 1.5 
mean = 1 
lognorm_distribution = stats.lognorm([std], loc=mean) 
lognorm_distribution_pdf = lognorm_distribution.pdf(X) 
plt.plot(X, lognorm_distribution_pdf, label="μ=1, σ=1.5") plt.title("Lognormal Distribution") 
plt.legend() 
plt.show()

泊松分布

泊松分布以法国数学家西蒙·丹尼斯·泊松的名字命名。这是一个离散的概率分布,这意味着它计算具有有限结果的事件——换句话说,它是一个计数分布。因此,泊松分布用于显示事件在指定时期内可能发生的次数。如果一个事件在时间上以固定的速率发生,那么及时观察到事件的数量(n)的概率可以用泊松分布来描述。例如,顾客可能以每分钟 3 次的平均速度到达咖啡馆。我们可以使用泊松分布来计算 9 个客户在 2 分钟内到达的概率。下面是概率质量函数公式:λ 是一个时间单位的事件率——在我们的例子中,它是 3。k 是出现的次数——在我们的例子中,它是 9。这里可以使用 Scipy 来完成概率的计算。

from scipy import stats print(stats.poisson.pmf(k=9, mu=3))
0.002700503931560479

泊松分布的曲线类似于正态分布,λ 表示峰值。

X = stats.poisson.rvs(mu=3, size=500) plt.subplots(figsize=(8, 5)) 
plt.hist(X, density=True, edgecolor="black") 
plt.title("Poisson Distribution") 
plt.show()

指数分布

指数分布是泊松点过程中事件之间时间的概率分布。指数分布的概率密度函数如下:λ 是速率参数,x 是随机变量。

X = np.linspace(0, 5, 5000) exponetial_distribtuion = stats.expon.pdf(X, loc=0, scale=1) plt.subplots(figsize=(8,5)) 
plt.plot(X, exponetial_distribtuion) 
plt.title("Exponential Distribution") 
plt.show()

二项分布

可以将二项分布视为实验中成功或失败的概率。有些人也可能将其描述为抛硬币概率。参数为 n 和 p 的二项式分布是在 n 个独立实验序列中成功次数的离散概率分布,每个实验都问一个是 - 否问题,每个实验都有自己的布尔值结果:成功或失败。本质上,二项分布测量两个事件的概率。一个事件发生的概率为 p,另一事件发生的概率为 1-p。这是二项分布的公式:

  • P = 二项分布概率
  • = 组合数
  • x = n次试验中特定结果的次数
  • p = 单次实验中,成功的概率
  • q = 单次实验中,失败的概率
  • n = 实验的次数

可视化代码如下:

X = np.random.binomial(n=1, p=0.5, size=1000) plt.subplots(figsize=(8, 5)) 
plt.hist(X) 
plt.title("Binomial Distribution") 
plt.show()

学生 t 分布

学生 t 分布(或简称 t 分布)是在样本量较小且总体标准差未知的情况下估计正态分布总体的均值时出现的连续概率分布族的任何成员。它是由英国统计学家威廉·西利·戈塞特(William Sealy Gosset)以笔名“student”开发的。PDF如下:n 是称为“自由度”的参数,有时可以看到它被称为“d.o.f.” 对于较高的 n 值,t 分布更接近正态分布。

import seaborn as sns 
from scipy import stats X1 = stats.t.rvs(df=1, size=4) 
X2 = stats.t.rvs(df=3, size=4) 
X3 = stats.t.rvs(df=9, size=4) plt.subplots(figsize=(8,5)) 
sns.kdeplot(X1, label = "1 d.o.f") 
sns.kdeplot(X2, label = "3 d.o.f") 
sns.kdeplot(X3, label = "6 d.o.f") 
plt.title("Student's t distribution") 
plt.legend() 
plt.show()

卡方分布

卡方分布是伽马分布的一个特例;对于 k 个自由度,卡方分布是一些独立的标准正态随机变量的 k 的平方和。PDF如下:这是一种流行的概率分布,常用于假设检验和置信区间的构建。在 Python 中绘制一些示例图:

X = np.arange(0, 6, 0.25) plt.subplots(figsize=(8, 5)) 
plt.plot(X, stats.chi2.pdf(X, df=1), label="1 d.o.f") 
plt.plot(X, stats.chi2.pdf(X, df=2), label="2 d.o.f") 
plt.plot(X, stats.chi2.pdf(X, df=3), label="3 d.o.f") 
plt.title("Chi-squared Distribution") 
plt.legend() 
plt.show()
http://www.dtcms.com/wzjs/597599.html

相关文章:

  • 网站建设一个人能做吗深圳小企业网站建设
  • 检索类的网站建设上饶市建设厅网站
  • wap网站的未来实名网站空间
  • 网站建设人员性格特点网站开发建设与维护
  • 有几个网站打不开seo技术学院
  • 框架网站建设广州网站建设外贸
  • 娱乐建设网站注册一个公司大概要多少钱
  • 为什么没人做同城购物网站宜春网站设计公司
  • 网站怎么吸引流量网店设计素材
  • 响应式网站的优势网站seo哪家公司好
  • 动漫设计培训机构哪里好龙岩seo推广
  • 佛山百度网站快速优化淘宝联盟做返利网站
  • apache新建网站番禺核酸检测点在哪
  • 中山如何建设网站阿里巴巴国际网站建设
  • 手机网站好处湖南湘江新区最新消息
  • cad线下培训班海南网站seo
  • 小说短篇做的好的网站怎么用VS2012建设网站
  • 做网站哪个语言好企业网站一般做多宽
  • 网站平台建设情况汇报电子简历表格 个人简历
  • 深圳网站建设专业乐云seo做偏门网站
  • 高端网站建设软件开发巨鹿网站建设设计
  • 网站备案资料 下载沈阳网站备案查询
  • 做多级分销的网站wordpress 解析
  • 企业网站商城建设方案高端营销网站建设
  • 怎么做网站的seo天津各区房价一览表
  • 软件外包公司招聘苏州seo怎么做
  • 网站开发职业生涯规划书百度主页面
  • 营销展示型网站模板电子商务网站建设参考文献2018
  • 建设银行网站怎么查开户行海兴县做网站
  • 浏览器怎样屏蔽网站ajax分页 WordPress