当前位置: 首页 > wzjs >正文

怎么在工商局网站查公司网页开发报价单

怎么在工商局网站查公司,网页开发报价单,深圳东风大厦 网站建设,关键词快速排名软件价格朴素贝叶斯 朴素贝叶斯算法简介 概率基础复习 学习目标 了解联合概率、条件概率和相关独立的概念知道贝叶斯公式知道拉普拉斯平滑系数 1.概率定义 概率定义为一件事情发生的可能性 扔出一个硬币,结果头像朝上 P(X) : 取值在[0, 1] 2.案例:判断女神对你的…

朴素贝叶斯

朴素贝叶斯算法简介

概率基础复习

学习目标

  • 了解联合概率、条件概率和相关独立的概念
  • 知道贝叶斯公式
  • 知道拉普拉斯平滑系数

1.概率定义

概率定义为一件事情发生的可能性
扔出一个硬币,结果头像朝上
P(X) : 取值在[0, 1]

2.案例:判断女神对你的喜欢情况

在讲这两个概率之前我们通过一个例子,来计算一些结果:
问题如下:
  • 女神喜欢的概率?
  • 职业是程序员并且体型匀称的概率?
  • 在女神喜欢的条件下,职业是程序员的概率?
  • 在女神喜欢的条件下,职业是程序员、体重超重的概率?
计算结果为:
P(喜欢) = 4/7
P(程序员, 匀称) = 1/7(联合概率)
P(程序员|喜欢) = 2/4 = 1/2(条件概率)
P(程序员, 超重|喜欢) = 1/4

思考题:在小明是产品经理并且体重超重的情况下,如何计算小明被女神喜欢的概率?
即P(喜欢|产品, 超重) = ?
此时我们需要用到朴素贝叶斯进行求解,在讲解贝叶斯公式之前,首先复习一下联合概率、条件概率和相互独立的概念。

3.联合概率、条件概率与相互独立

联合概率:包含多个条件,且所有条件同时成立的概率
记作:P(AB) = P(A) *P(B|A) = P(B) *P(A|B)
条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率
记作:P(A|B)
相互独立:如果P(A, B) = P(A)P(B),则称事件A与事件B相互独立。
P(A,B|C) = P(A|C)*P(B|C)

4.贝叶斯公式

4.1 公式介绍

P(C) 表示 C 出现的概率,一般是目标值
P(W|C) 表示 C 条件 W 出现的概率
P(W) 表示 W 出现的概率

4.2 案例计算

那么思考题就可以套用贝叶斯公式这样来解决:
P(喜欢|产品, 超重) = P(产品, 超重|喜欢)P(喜欢)/P(产品, 超重)
上式中,
  • P(产品, 超重|喜欢)和P(产品, 超重)的结果均为0,导致无法计算结果。这是因为我们的样本量太少了,不具有代表性。
  • 本来现实生活中,肯定是存在职业是产品经理并且体重超重的人的,P(产品, 超重)不可能为0;
  • 而且事件“职业是产品经理”和事件“体重超重”通常被认为是相互独立的事件,但是,根据我们有限的7个样本计算“P(产品, 超重) = P(产品)P(超重)”不成立。
而朴素贝叶斯可以帮助我们解决这个问题。
  • 朴素贝叶斯,简单理解,就是
假定了特征与特征之间相互独立的贝叶斯公式
  • 也就是说,朴素贝叶斯,
之所以朴素,就在于假定了特征与特征相互独立。
所以,思考题如果按照朴素贝叶斯的思路来解决,就可以是
P(产品, 超重) = P(产品) * P(超重) = 2/7 * 3/7 = 6/49
p(产品, 超重|喜欢) = P(产品|喜欢) * P(超重|喜欢) = 1/2 * 1/4 = 1/8
P(喜欢|产品, 超重) = P(产品, 超重|喜欢)P(喜欢)/P(产品, 超重) = 1/8 * 4/7 / 6/49 = 7/12

那么这个公式如果应用在文章分类的场景当中,我们可以这样看:
公式分为三个部分:
  • P(C):每个文档类别的概率(某文档类别数/总文档数量)
  • P(W│C):给定类别下特征(被预测文档中出现的词)的概率
    • 计算方法:P(F1│C)=Ni/N (训练文档中去计算)
      • Ni为该F1词在C类别所有文档中出现的次数
      • N为所属类别C下的文档所有词出现的次数和
  • P(F1,F2,…) 预测文档中每个词的概率
如果计算两个类别概率比较:
所以我们只要比较前面的大小就可以,得出谁的概率大

4.3 文章分类计算

需求:通过前四个训练样本(文章),判断第五篇文章,是否属于China类
计算结果
P(C|Chinese, Chinese, Chinese, Tokyo, Japan) -->
P(Chinese, Chinese, Chinese, Tokyo, Japan|C) * P(C) / P(Chinese, Chinese, Chinese, Tokyo, Japan) 
=
P(Chinese|C)^3 * P(Tokyo|C) * P(Japan|C) * P(C) / [P(Chinese)^3 * P(Tokyo) * P(Japan)]# 这个文章是需要计算是不是China类,是或者不是最后的分母值都相同:# 首先计算是China类的概率: 
P(Chinese|C) = 5/8
P(Tokyo|C) = 0/8
P(Japan|C) = 0/8# 接着计算不是China类的概率:
P(Chinese|C`) = 1/3
P(Tokyo|C`) = 1/3
P(Japan|C`) = 1/3


问题:从上面的例子我们得到P(Tokyo|C)和P(Japan|C)都为0,这是不合理的,如果词频列表里面有很多出现次数都为0,很可能计算结果都为0.

解决方法:P(F1∣C)=Ni+αN+α∗m P( F1∣ C)=​ N+ αm​​ Ni+ α​​
m为训练文档中统计出的特征词个数
# 这个文章是需要计算是不是China类:首先计算是China类的概率:  0.0003P(Chinese|C) = 5/8 --> 6/14P(Tokyo|C) = 0/8 --> 1/14P(Japan|C) = 0/8 --> 1/14接着计算不是China类的概率: 0.0001P(Chinese|C`) = 1/3 -->(经过拉普拉斯平滑系数处理) 2/9P(Tokyo|C`) = 1/3 --> 2/9P(Japan|C`) = 1/3 --> 2/9


5 小结

  • 概率【了解】
    • 一件事情发生的可能性
  • 联合概率【知道】
    • 包含多个条件,且所有条件同时成立的概率
  • 条件概率【知道】
    • 事件A在另外一个事件B已经发生条件下的发生概率
  • 贝叶斯公式【掌握】

文章转载自:

http://P6zD3Mww.nyhtf.cn
http://mwmvG01E.nyhtf.cn
http://y8vyvR4h.nyhtf.cn
http://ErZpUpIZ.nyhtf.cn
http://pQ6LHQ6U.nyhtf.cn
http://F6ao9eXJ.nyhtf.cn
http://CZoiluqy.nyhtf.cn
http://gwwgzvKK.nyhtf.cn
http://9pk13puU.nyhtf.cn
http://ONdWQjkR.nyhtf.cn
http://48P45Rn1.nyhtf.cn
http://NBhTczia.nyhtf.cn
http://VFAs3pZ6.nyhtf.cn
http://A5kYX8WE.nyhtf.cn
http://g51wPu0i.nyhtf.cn
http://3mZEVg7X.nyhtf.cn
http://vOSXgmtQ.nyhtf.cn
http://qIsDywt9.nyhtf.cn
http://TXEQauKQ.nyhtf.cn
http://VkXsENh8.nyhtf.cn
http://U7d1cTR6.nyhtf.cn
http://V181Y9uF.nyhtf.cn
http://Tr8xqRtC.nyhtf.cn
http://Dmqra73U.nyhtf.cn
http://tsWEcbGE.nyhtf.cn
http://4rDrcACV.nyhtf.cn
http://y53UfGlm.nyhtf.cn
http://UDb0F5Ws.nyhtf.cn
http://bXJTOtcx.nyhtf.cn
http://ig9M5oE2.nyhtf.cn
http://www.dtcms.com/wzjs/745320.html

相关文章:

  • 海南景区网站建设方案wordpress文章如何分类添加
  • 诚信网站备案中心seo优化人员
  • 注册公司流程流程图搜索引擎优化的五个方面
  • 网站建设 预付款北京官网seo
  • 那个网站做外贸最好商昊网站建设
  • 安徽天长建设局网站西安关键词seo
  • 做网站哪家公司便宜网站建设费用是否资本化
  • 上海著名网站建设企业类网站设计
  • 手机网站下拉列表快速做网站流量数据统计分析
  • 长安镇仿做网站电子商务网站的建设报告
  • 郑州做网站需要多少钱东莞网站设计百年
  • 建设网站投资多少钱房屋装修网站模板
  • 天津seo方案新乐做网站优化
  • 专业做传奇网站解析毛织厂家东莞网站建设
  • 网站开发有哪些类型网站导航是什么意思
  • 企业官方网站怎么查wordpress显示文章阅读数
  • 台州做网站优化哪家好车辆保险网站
  • 连云港做网站哪里好历史看过的网站
  • 有哪些免费网站可以做店招模板规格
  • 网站怎么快速做收录移动应用开发就业方向和前景
  • 有哪些做公司网站建筑网站源码
  • wordpress在服务器上安装郑州关键词优化费用
  • 知名seo网站优化软件开发工具的选择与评价
  • 东莞seo建站推广费用阿里企业邮箱费用
  • 免费小程序制作网站潍坊个人做网站的公司
  • 有没有专业做汽车坐垫网站网站建设凭证
  • 有没有高质量的网站都懂的asp企业网站开发技术
  • 网站页面优化什么网站可以做数据调查
  • 大型网站开发项目合同公司网站制作投标
  • seo网站推广软件 快排不用下载就能看的网站的浏览器