当前位置: 首页 > wzjs >正文

网站收录查询爱站如何查看网站蜘蛛

网站收录查询爱站,如何查看网站蜘蛛,设计制作小车教学设计,中小型企业 公司网站建设得物 数据挖掘 一、线性回归 y ax 中参数 a 如何计算 1.1. a 是待学习参数 在线性回归中,a 是模型的权重(或斜率),需要通过数据来学习其最优值。学习的目标是找到 a 的值,使得模型的预测值 y ^ a x \hat{y} ax …

得物 数据挖掘

一、线性回归 y = ax 中参数 a 如何计算

1.1. a 是待学习参数

在线性回归中,a 是模型的权重(或斜率),需要通过数据来学习其最优值。学习的目标是找到 a 的值,使得模型的预测值 y ^ = a x \hat{y} = ax y^=ax 尽可能接近真实值 y 。

1.2. 最小二乘法

在线性回归中,通常使用最小二乘法来学习 a 。最小二乘法的目标是最小化误差平方和(即真实值 y 和预测值 y ^ \hat{y} y^ 之间的差异):
误差平方和 = ∑ i = 1 n ( y i − a x i ) 2 \text{误差平方和} = \sum_{i=1}^{n} (y_i - a x_i)^2 误差平方和=i=1n(yiaxi)2
通过最小化这个目标函数,可以找到 a a a 的最优值。

1.2.1. 数据准备

假设有 n 个数据点 ( x i , y i ) (x_i, y_i) (xi,yi),其中 i = 1 , 2 , … , n i = 1, 2, \dots, n i=1,2,,n

1.2.2. 最小二乘法

通过最小化误差平方和来求解 a a a,即:
误差平方和 = ∑ i = 1 n ( y i − a x i ) 2 \text{误差平方和} = \sum_{i=1}^{n} (y_i - a x_i)^2 误差平方和=i=1n(yiaxi)2

1.2.3. 求导并令导数为零

对误差平方和关于 a a a 求导,并令导数为零:
d d a ( ∑ i = 1 n ( y i − a x i ) 2 ) = 0 \frac{d}{da} \left( \sum_{i=1}^{n} (y_i - a x_i)^2 \right) = 0 dad(i=1n(yiaxi)2)=0

展开并简化:
− 2 ∑ i = 1 n x i ( y i − a x i ) = 0 -2 \sum_{i=1}^{n} x_i (y_i - a x_i) = 0 2i=1nxi(yiaxi)=0
∑ i = 1 n x i y i − a ∑ i = 1 n x i 2 = 0 \sum_{i=1}^{n} x_i y_i - a \sum_{i=1}^{n} x_i^2 = 0 i=1nxiyiai=1nxi2=0

1.2.4. 解方程求 a a a

将方程整理为:
a = ∑ i = 1 n x i y i ∑ i = 1 n x i 2 a = \frac{\sum_{i=1}^{n} x_i y_i}{\sum_{i=1}^{n} x_i^2} a=i=1nxi2i=1nxiyi

1.2.5. 最终公式

因此,系数 a 的计算公式为:
a = ∑ i = 1 n x i y i ∑ i = 1 n x i 2 a = \frac{\sum_{i=1}^{n} x_i y_i}{\sum_{i=1}^{n} x_i^2} a=i=1nxi2i=1nxiyi

二、最大似然估计(Maximum Likelihood Estimation, MLE)

见【搜广推校招面经十六】:交叉熵可以通过MLE推导
最大似然估计是一种用于估计统计模型参数的方法,它通过寻找能使观察到的数据出现概率最大的参数值来确定模型的参数。在简单线性回归模型 y = a x y = ax y=ax(无截距项)中,我们可以使用MLE来估计斜率 a a a 的值。
通过最大化对数似然函数,我们可以获得与最小二乘法相同的参数估计结果。这不仅验证了最小二乘法的有效性,还展示了MLE作为一种【通用方法】的强大之处。

2.1. 基本概念

  1. 给定一组独立同分布(i.i.d.)的数据点 ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x n , y n ) (x_1, y_1), (x_2, y_2), ..., (x_n, y_n) (x1,y1),(x2,y2),...,(xn,yn),假设这些数据点符合某个特定的概率分布(例如正态分布),MLE的目标是找到最有可能生成这些观测数据的参数值。
  2. 对于线性回归模型 y = a x y = ax y=ax,我们通常假设误差项服从正态分布 N ( 0 , σ 2 ) N(0, \sigma^2) N(0,σ2)。这意味着每个观测值 y i y_i yi 可以被看作是从正态分布 N ( a x i , σ 2 ) N(ax_i, \sigma^2) N(axi,σ2) 中抽取的样本。

2. 计算斜率 a a a

步骤

  1. 定义似然函数: 对于给定的参数 a a a σ 2 \sigma^2 σ2,似然函数 L ( a , σ 2 ) L(a, \sigma^2) L(a,σ2) 是所有观测值同时发生的联合概率密度。

    如果假设误差项服从正态分布,则似然函数可以写为:
    L ( a , σ 2 ) = ∏ i = 1 n 1 2 π σ 2 exp ⁡ ( − ( y i − a x i ) 2 2 σ 2 ) L(a, \sigma^2) = \prod_{i=1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(y_i - ax_i)^2}{2\sigma^2}\right) L(a,σ2)=i=1n2πσ2 1exp(2σ2(yiaxi)2)

  2. 取对数似然函数: 为了简化计算,通常取似然函数的自然对数,得到对数似然函数 ln ⁡ L ( a , σ 2 ) \ln L(a, \sigma^2) lnL(a,σ2)
    ln ⁡ L ( a , σ 2 ) = − n 2 ln ⁡ ( 2 π ) − n 2 ln ⁡ ( σ 2 ) − 1 2 σ 2 ∑ i = 1 n ( y i − a x i ) 2 \ln L(a, \sigma^2) = -\frac{n}{2}\ln(2\pi) - \frac{n}{2}\ln(\sigma^2) - \frac{1}{2\sigma^2}\sum_{i=1}^{n}(y_i - ax_i)^2 lnL(a,σ2)=2nln(2π)2nln(σ2)2σ21i=1n(yiaxi)2

  3. 最大化对数似然函数: 要找到使得对数似然函数最大的 a a a 值,可以通过对 a a a 求导并令导数等于零来求解。注意到对 σ 2 \sigma^2 σ2 的优化不影响 a a a 的估计(因为 σ 2 \sigma^2 σ2 在对 a a a 求导时会被消去),所以我们主要关注与 a a a 相关的部分:
    ∂ ln ⁡ L ∂ a = 1 σ 2 ∑ i = 1 n x i ( y i − a x i ) = 0 \frac{\partial \ln L}{\partial a} = \frac{1}{\sigma^2} \sum_{i=1}^{n} x_i(y_i - ax_i) = 0 alnL=σ21i=1nxi(yiaxi)=0

    解这个方程可得:
    ∑ i = 1 n x i y i = a ∑ i = 1 n x i 2 \sum_{i=1}^{n} x_i y_i = a \sum_{i=1}^{n} x_i^2 i=1nxiyi=ai=1nxi2

    因此,斜率 a a a 的最大似然估计为:
    a = ∑ i = 1 n x i y i ∑ i = 1 n x i 2 a = \frac{\sum_{i=1}^{n} x_i y_i}{\sum_{i=1}^{n} x_i^2} a=i=1nxi2i=1nxiyi

三、mse的缺点?

均方误差(Mean Squared Error, MSE)是回归分析中常用的损失函数之一,用于衡量预测值与真实值之间的差异。 MSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 MSE=n1i=1n(yiy^i)2

3.1. 对异常值敏感

  • MSE通过平方误差来惩罚预测错误,这意味着较大的误差会被平方放大,从而对异常值(outliers)特别敏感。
  • 如果数据集中存在异常值,那么MSE可能会给出一个非常高的误差值,导致模型过度关注这些异常点,而不是整体数据的趋势。

3.2. 不适用于概率分布不对称的情况

  • 在某些情况下,预测误差的概率分布可能是不对称的。例如,在金融风险评估中,低估可能带来的损失通常比高估更为严重。MSE假设所有方向上的误差都是等价的,因此它不适合处理那些需要不同对待正负误差的应用场景。

文章转载自:

http://xQKIMLEC.mqmmc.cn
http://LzB756ov.mqmmc.cn
http://jkgN1PpG.mqmmc.cn
http://9xRE46M0.mqmmc.cn
http://pGUQR6F5.mqmmc.cn
http://HavbSTbn.mqmmc.cn
http://EToAWjkC.mqmmc.cn
http://tZHdhWAW.mqmmc.cn
http://rQ9Boooi.mqmmc.cn
http://KRtZSuos.mqmmc.cn
http://OKTNJeoF.mqmmc.cn
http://inbF3qc7.mqmmc.cn
http://CorNH5Fp.mqmmc.cn
http://TGFCilLi.mqmmc.cn
http://ryv8VuHm.mqmmc.cn
http://KdDM3zRb.mqmmc.cn
http://13ASDH3i.mqmmc.cn
http://fxsROj02.mqmmc.cn
http://1IYHsitC.mqmmc.cn
http://ngQhdmFS.mqmmc.cn
http://LJ5AiYP6.mqmmc.cn
http://B8isFt1P.mqmmc.cn
http://LkPLiS8P.mqmmc.cn
http://jssoKkib.mqmmc.cn
http://PzivKXes.mqmmc.cn
http://JcAFRvrk.mqmmc.cn
http://KaiExKbM.mqmmc.cn
http://VRS1oDve.mqmmc.cn
http://WzkyfQ38.mqmmc.cn
http://lphDOE7H.mqmmc.cn
http://www.dtcms.com/wzjs/756085.html

相关文章:

  • 自己制作的网页怎么发布做关键词优化
  • 网站专题教程wordpress 友荐
  • 公司搭建一个网站姜堰 万邦建设集团网站
  • 国外专门用于做网站图片的网站 维护 协议
  • 快手直播间挂人气自助网站企业通用网站模板
  • 网站开发用的那些语言自己做图片上传网站
  • 高端的网站设计公司工作总结怎么写
  • 乱起封神是那个网站开发的华容县住房和城乡建设局网站
  • 移动互联网网站开发wordpress 开发 电商
  • 网站建设基本流程微信建微网站
  • 淘宝的网站建设的目标帮一个企业做网站流程
  • phpmysql旅游网站开发贵阳网站建设推广
  • 网站开发项目意义帝国建站程序
  • wordpress网站下载文件WordPress怎么做CMS
  • 徐州手机网站制作公司戴尔公司网站建设的特点是什么
  • 怎么做免流网站网站title写法
  • 数据库网站宝山网站建设推广
  • 安顺市住房与城乡建设局网站wordpress百度主动推送
  • 微信小程序外联网站做百度网站接到多少客户电话号码
  • 哈尔滨定制网站建设奇迹网站自己做
  • 吴忠网站建设企点qq售卖平台
  • 电子商务企业网站有哪些win8风格wordpress博客主题
  • 石家庄网站建设技术支持网站开发命名规则
  • sqlite做网站网站建设周记
  • 潍坊市企业网站建设做外国订单有什么网站
  • 承德市网站开发制作一个简单的网站
  • 风景名胜区建设部网站html底部的版权代码
  • 网站建设需求报价明细网页版梦幻西游贴吧
  • 开发app学什么编程语言珠海百度关键词优化
  • 分类网站有哪些ppt模板百度网盘