当前位置：首页 > wzjs >正文

滨江网站开发企业培训十大热门课程

wzjs 2025/7/29 4:36:36

滨江网站开发,企业培训十大热门课程,简单的做网站软件有啥,软件测试外包公司排名有哪些文章目录 1.概率论基础1.1 单事件概率1.2 多事件概率1.3 条件概率1.3.1 多事件概率与条件概率的区别 1.4 贝叶斯定理传统思维误区贝叶斯定理计算 2. 朴素贝叶斯法2.1 基本概念2.2 模型2.3 学习策略2.4 优化算法2.5 优化技巧拉普拉斯平滑对数似然 3. 情感分析实战3.1 流程3.2 模…

文章目录

- 1.概率论基础
- - 1.1 单事件概率
  - 1.2 多事件概率
  - 1.3 条件概率
  - - 1.3.1 多事件概率与条件概率的区别
  - 1.4 贝叶斯定理
  - 传统思维误区
  - 贝叶斯定理计算
- 2. 朴素贝叶斯法
- - 2.1 基本概念
  - 2.2 模型
  - 2.3 学习策略
  - 2.4 优化算法
  - 2.5 优化技巧
  - - 拉普拉斯平滑
    - 对数似然
- 3. 情感分析实战
- - 3.1 流程
  - 3.2 模型评价
  - 3.3 应用场景
  - 3.4 局限性
  - 3.4 局限性

1.概率论基础

1.1 单事件概率

定义：一个事件发生的可能性。
例子：假设事件A表示“一个文本是正向的”，则P(A) = 正向文本数 / 总文本数。
解释：比如有20个文本，其中13个是正向的，那么P(A) = 13/20 = 0.65。

1.2 多事件概率

定义：多个事件同时发生的概率。
例子：事件A（文本是正向的）和事件B（文本包含单词“happy”）同时发生的概率P(A,B) = P(A∩B) = 3/20。

举个例子：假设某餐厅统计发现：

30%的订单点了汉堡（事件A）
20%的订单同时点了汉堡和薯条（事件A∩B）

那么：

多事件概率：P(汉堡且薯条) = 20%
（直接表示同时点这两样的概率）

1.3 条件概率

定义：在已知事件B发生的情况下，事件A发生的概率，记作P(A|B)。
公式：P(A|B) = P(A∩B) / P(B)。
作用：缩小计算范围。例如，已知文本包含“happy”，计算它是正向的概率时，只需关注包含“happy”的文本。

延续刚刚的例子：已知某餐厅统计发现：

薯条订单占全店40%（事件B）
汉堡和薯条同时点占20%（事件A∩B）

则：

条件概率：P(汉堡|已点薯条) = 20%/40% = 50% 【两者同时的概率 / 单单薯条的概率】
（在已经点薯条的订单中，有50%会加购汉堡）

1.3.1 多事件概率与条件概率的区别

维度	多事件概率	条件概率
计算范围	全局样本空间	限定在条件事件发生的子空间
信息量	反映单纯共存概率	揭示事件间的关联强度
应用场景	分析事件组合频率	研究因果关系/预测

典型误区分辨

❌错误理解：“今天下雨且堵车”（多事件概率） vs “下雨导致堵车”（条件概率）
✅正确区分：
- 多事件概率：全市范围内同时下雨和堵车的概率（比如10%）
- 条件概率：在下雨的日子里发生堵车的概率（可能高达70%）

NLP应用实例（情感分析）

假设分析1,000条商品评论：

200条出现"价格"（事件A）
50条同时出现"价格"和"昂贵"（事件A∩B）
"昂贵"出现总次数100次（事件B）

多事件概率：
P(“价格"且"昂贵”) = 50/1000 = 5%
（所有评论中同时包含这两个词的概率）

条件概率：
P(“昂贵”|出现"价格") = 50/200 = 25%
（在提到价格的评论中，"昂贵"出现的概率）【两者同时的概率 / 单单价格的概率】

1.4 贝叶斯定理

定义：通过已知事件Y反推事件X的概率。贝叶斯定理是"用结果反推原因"的概率计算方法。就像侦探破案：已知犯罪现场有某种证据（结果），计算某个嫌疑人作案（原因）的概率。
公式：P(X|Y) = P(Y|X) * P(X) / P(Y)。
用途：在分类问题中，通过观测数据反推类别概率。

举个例子（疾病检测）
假设：

某疾病在人群中的患病率是1%（先验概率）
检测准确率：
- 真有病的人，99%能测出阳性（真阳性率）
- 没病的人，2%会误测为阳性（假阳性率）

问题：如果一个人检测呈阳性，他实际患病的概率是多少？

传统思维误区

很多人会直接认为概率是99%，忽略了基础患病率。

贝叶斯定理计算

P(患病|阳性) = P(阳性|患病) * P(患病) / P(阳性) P(阳性) = [P(阳性|患病) * P(患病) + P(阳性|正常) * P(正常)
= (99% * 1%) / (99% * 1% + 2% * 99%) 这里的P(正常)更多的是：1-P(患病) = 99%
≈ 33%

【“患病”是因，“阳性”是果，先乘因，再除果】

即使检测呈阳性，实际患病概率只有33%！

接下来我将对公式进行拆解：

P(原因|结果) = [P(结果|原因) × P(原因)] / P(结果)