当前位置: 首页 > wzjs >正文

网站上怎么引用视频wordpress 免签约支付

网站上怎么引用视频,wordpress 免签约支付,wordpress问题解决,菏泽 网站建设一、经验误差与过拟合 误差: 训练误差(经验误差):在训练集上的误差。泛化误差:模型应用到新样本上的误差。 过拟合(麻烦):训练集上表现太好,但新样本上表现不好&#xf…

一、经验误差与过拟合

  • 误差
    • 训练误差(经验误差):在训练集上的误差。
    • 泛化误差:模型应用到新样本上的误差。
  • 过拟合(麻烦):训练集上表现太好,但新样本上表现不好(训练过度把训练集样本特征当作了样本的一般特征)。
  • 欠拟合:训练集上就没表现好。

二、评估方法

  • 评估泛化误差 ⟹ \Longrightarrow 设置一个测试集(测试集上的误差可近似于模型的泛化误差)。

:测试样本要尽可能的不出现在训练样本中。

  • 数据集划分方法

    • 留出法(常用):直接将整个数据集分为两个集合(训练集、测试集),尽可能保证数据分布的一致性(分层抽样(等比例),……)。
    • 交叉验证法(常用):将数据集分为 k k k 份,每次随机选择 k − 1 k-1 k1 个子集作为训练集,剩下一个子集作为测试集(常用 10 10 10 折交叉验证),多次划分取均值。

    :当 k k k 等于样本数时,即为交叉验证的特殊情况留一法(但是样本数量过多就不适用)。

    • 自助法(不常用):每次都是有放回抽样,这样保证了数据集中有一部分样本不会出现在训练集中(适用于集成学习)。

:一般在模型训练和应用的过程中,将会把数据集分为训练数据和测试数据,前者又分为训练集和验证集,根据验证集上的效果来进行模型选择和调参,模型在后者上的表现效果主要是评估模型泛化能力。

三、模型性能度量

  • 错误率精度(分类任务)

  • 查准率查全率 F 1 F1 F1

    • 二分类举例:

      • 真实情况预测结果
        正例反例
        正例TP(真正例)FN(假反例)
        反例FP(假正例)TN(真反例)

      其中查准率 P P P 与查全率 R R R (二者相互矛盾)分别定义为:
      P = T P T P + F P , R = T P T P + F N . \begin{align*} P=\frac{TP}{TP+FP},\\ R=\frac{TP}{TP+FN}. \end{align*} P=TP+FPTP,R=TP+FNTP.

      • 平衡点:查准率=查全率的位置。
      • F 1 F1 F1 是基于查准率和查全率的调和平均: 1 F 1 = 1 2 ⋅ ( 1 P + 1 R ) \frac{1}{F1}=\frac{1}{2}\cdot(\frac{1}{P}+\frac{1}{R}) F11=21(P1+R1)
      • F 1 F1 F1 的一般形式为 F β F_\beta Fβ (加权调和平均): F β = ( 1 + β 2 ) × P × R ( β 2 × P ) + R ( β > 0 ) F_\beta=\frac{(1+\beta^2)\times P\times R}{(\beta^2\times P)+R}\quad(\beta>0) Fβ=(β2×P)+R(1+β2)×P×R(β>0)。(其中 β > 1 \beta>1 β>1 时查全率影响较大, β < 1 \beta<1 β<1 时查准率影响更大, β = 1 \beta=1 β=1 时变为标准的 F 1 F1 F1)。

    :在 P − R P-R PR 曲线图中,若一个学习器的曲线被另一个学习器的曲线包住则后者的性能好于前者(横轴为查全率、纵轴为查准率)。

    • 在多分类任务中,会产生多个混淆矩阵,如果先计算出查准率和查全率再求平均值就得到了宏查准率宏查全率,再使用宏查准、查全率按照上述对应的公式替换,就得到了 F 1 F1 F1 ;若先对 T P 、 F P 、 T N 、 F N TP、FP、TN、FN TPFPTNFN 这些求平均,再计算查准率、查全率、 F 1 F1 F1 就得到了微查准率微查全率 F 1 F1 F1
  • R O C ROC ROC A U C AUC AUC

    • R O C ROC ROC(假正例率为横轴,真正例率):
      T P R = T P T P + F N , F P R = F P T N + F P . TPR=\frac{TP}{TP+FN},\\ FPR=\frac{FP}{TN+FP}. TPR=TP+FNTP,FPR=TN+FPFP.
      性能对比上的方式和 P − R P-R PR 曲线是一样的;当 R O C ROC ROC 图中的曲线交叉的时候就出现 A U C AUC AUC 的概念,即 R O C ROC ROC 曲线下的面积(类似定积分精确定义求面积的含义):
      A U C = 1 2 ∑ i = 1 m − 1 ( x i + 1 − x i ) ⋅ ( y i + y i + 1 ) . AUC=\frac{1}{2}\sum^{m-1}_{i=1}(x_{i+1}-x_{i})\cdot(y_{i}+y_{i+1}). AUC=21i=1m1(xi+1xi)(yi+yi+1).
  • 代价敏感错误率、代价曲线

    • 上述的性能度量都默认的“错误”的时候代价都是均等的,

    • 二分类的代价矩阵

      真实类别预测类别
      第 0 类第 1 类
      第 0 类0cost01
      第 1 类cost100
    • 一般都希望“总体代价”能最小,若上述的第 0 0 0 类为正类、第 1 1 1 类为反类,则代价敏感错误率为:
      E ( f ; D ; c o s t ) = 1 m ( ∑ x i ∈ D + Ⅱ ( f ( x i ) ≠ y i ) × c o s t 01 + ∑ x i ∈ D − Ⅱ ( f ( x i ) ≠ y i ) × c o s t 10 ) . E(f;D;cost)=\frac{1}{m}\Bigg(\sum_{x_i\in D^+}Ⅱ\big(f(x_i)\neq y_i\big)\times cost_{01}+\sum_{x_i\in D^-}Ⅱ\big(f(x_i)\neq y_i\big)\times cost_{10}\Bigg). E(f;D;cost)=m1(xiD+(f(xi)=yi)×cost01+xiD(f(xi)=yi)×cost10).
      其中 m m m D D D 的总样本数, D D D 是样例集, D + D^+ D+ 是正例子集、 D − D^- D 是反例子集;当然多分类的任务也是同样的道理。

      正概率代价(取值[0, 1]):
      P ( + ) c o s t = p × c o s t 01 p × c o s t 01 + ( 1 − p ) × c o s t 10 . P(+)cost=\frac{p\times cost_{01}}{p\times cost_{01}+(1-p)\times cost_{10}}. P(+)cost=p×cost01+(1p)×cost10p×cost01.
      其中 p p p 表示的是样例为正例的概率;

      归一化代价(取值[0, 1]):
      c o s t n o r m = F N R × p × c o s t 01 + F P R × ( 1 − p ) × c o s t 10 p × c o s t 01 + ( 1 − p ) × c o s t 10 . cost_{norm}=\frac{FNR\times p\times cost_{01}+FPR\times (1-p)\times cost_{10}}{p\times cost_{01}+(1-p)\times cost_{10}}. costnorm=p×cost01+(1p)×cost10FNR×p×cost01+FPR×(1p)×cost10.
      其中 F N R = 1 − T P R FNR=1-TPR FNR=1TPR正概率代价图横轴为正概率代价,纵轴为归一化代价;绘制方式为从 R O C ROC ROC 曲线上找到一点 ( T P R , F P R ) (TPR,FPR) (TPR,FPR) 计算出对应的 F N R FNR FNR ,然后于正概率代价图上绘制一条从 ( 0 , F P R ) (0,FPR) (0,FPR) ( 1 , F N R ) (1,FNR) (1,FNR) 的线段,线段与 x x x 轴围成的面积为该条件下的期望总体代价,这样画成的所有线段与 x x x 轴围成的面积为所有条件下学习器的期望总体代价。

  • 比较检验(参考概率论与数理统计的假设检验部分)

    • 假设检验

      相当于从 m m m 个样本中选出 ε × m ^ \hat{\varepsilon \times m} ε×m^ 个样本。

    • 交叉验证 t t t 检验(对应 k k k 折交叉验证, t t t 分布)

    • M c N e m a r McNemar McNemar 检验 χ 2 \chi^2 χ2 分布)

    • F r i e d m a n Friedman Friedman 检验与 N e m e n y i Nemenyi Nemenyi 后续检验 F F F 分布)

  • 误差、偏差

    • 泛化误差可分解为偏差、方差与噪声之和。

    • 训练不足 → \rightarrow 模型拟合能力不强 → \rightarrow 偏差主导泛化错误率

      训练加深 → \rightarrow 模型拟合能力增强 → \rightarrow 方差主导泛化错误率


文章转载自:

http://2Lt5Wbpl.mnygn.cn
http://XhCaQOXx.mnygn.cn
http://7p1Sueft.mnygn.cn
http://LgjW9m3n.mnygn.cn
http://spKNejU3.mnygn.cn
http://VFDZjw1V.mnygn.cn
http://7JACY3Nl.mnygn.cn
http://01hjYPi6.mnygn.cn
http://PLqwoCWc.mnygn.cn
http://gU8ADeAr.mnygn.cn
http://o3a0j5fx.mnygn.cn
http://g4utgAXu.mnygn.cn
http://3hOiuc7l.mnygn.cn
http://jkDhMxJo.mnygn.cn
http://EwDdb53D.mnygn.cn
http://SQANudsF.mnygn.cn
http://Mz49AMeo.mnygn.cn
http://rkSc4v5k.mnygn.cn
http://QAIoe8GG.mnygn.cn
http://a4WLDZ9b.mnygn.cn
http://q8x3qfns.mnygn.cn
http://uha7cHh0.mnygn.cn
http://knE50T25.mnygn.cn
http://oeRjMyaj.mnygn.cn
http://Ng8lFujb.mnygn.cn
http://eBfjwa6v.mnygn.cn
http://8QnMckn3.mnygn.cn
http://ySes7Fox.mnygn.cn
http://U2zKD4G4.mnygn.cn
http://WtFJYb03.mnygn.cn
http://www.dtcms.com/wzjs/723451.html

相关文章:

  • 关于做网站的合同南康做网站
  • 企业网站空间买虚拟主机信阳seo优化
  • 福州网站制作策划响应式网站广州网站建设
  • 建站网站盗用了别人的案例上海网络平台有哪些
  • 网站建设邀标函建设银行mylove网站
  • 建设厅网站2015154vr哪家公司做得好
  • 老男孩linux网站霸州网站优化
  • 网站备案幕布 下载海南省住房城乡建设厅网站首页
  • 网站自定义功能实现学做沪江网站要多久
  • 企业网站建设注意点怎么做电脑网站后台
  • 手机网站收录北京中航空港建设工程有限公司网站
  • 网站建设的数据储存在哪里山东省建筑住房和城乡建设厅网站
  • 网站升级建设书店网站建设目标调研的方案
  • 增城新塘镇 企业网站建设发生太多重定位wordpress
  • 东莞有哪些做推广的网站前端 wordpress
  • 电子商务网站的整个建设流程seo网络优化前景怎么样
  • 做家具有那个网站好网站色调红黑
  • 象山县城乡和住房建设局网站中装建设集团
  • 云网站 制作wordpress可注册
  • 旅行社网站 模板云服务器可以用来做网站么
  • 官方网站建设教程同城分类网站建设
  • 网站建设及推广培训网站 数据库 sql 导入
  • 全国做网站的公司森东网站建设
  • 沈阳网站建设方案模板应城网站建设
  • 甘肃省住房和城乡建设部网站首页flash网站制作教程 下载
  • thinkphp 门户网站开发app的软件
  • 自己能建设网站吗工信部网站备案被注销
  • vps搭建vpn无法访问国内网站重庆做网站letide
  • 经济研究院网站建设方案星夜智能建站平台
  • 天台建设局网站外链屏蔽逐步解除