当前位置: 首页 > news >正文

朴素贝叶斯算法总结

核心思想
基于贝叶斯定理:P(A|B) = P(B|A)·P(A)/P(B)
特征条件独立性假设:特征间相互独立
属于生成式模型

三大变体
1. 多项式朴素贝叶斯(MultinomialNB)
适用:离散特征(如文本词频统计)
特点:统计特征出现次数
场景:文本分类、文档分类

2. 高斯朴素贝叶斯(GaussianNB)
适用:连续特征(符合正态分布)
特点:假设特征服从高斯分布
场景:数值数据分类

3. 伯努利朴素贝叶斯(BernoulliNB)
适用:二值离散特征(0/1)
特点:关注特征是否存在
场景:文本分类(单词出现与否)

算法流程
1. 计算先验概率:P(类别)
2. 计算条件概率:P(特征|类别)
3. 应用贝叶斯公式:P(类别|特征) ∝ P(类别)·ΠP(特征|类别)
4. 选择最大后验概率的类别

实际应用
文本分类:垃圾邮件识别、情感分析
手写数字识别:load_digits数据集
推荐系统:用户行为预测

优势特点
计算效率高
适合高维数据
对小规模数据表现好
训练速度快

局限性
特征独立性假设在实际中很难满足
对输入数据形式敏感
零概率问题需要平滑处理

实践要点
文本处理需先向量化(CountVectorizer/TfidfVectorizer)
连续特征需验证正态分布假设
使用拉普拉斯平滑避免零概率问题

http://www.dtcms.com/a/350482.html

相关文章:

  • 互联网大厂Java面试实录:Spring Boot与微服务架构解析
  • cmd命令行删除文件夹
  • rk3566编译squashfs报错解决
  • QT5封装的日志记录函数
  • 算法练习-遍历对角线
  • 开源夜莺里如何引用标签和注解变量
  • VTK开发笔记(四):示例Cone,创建圆锥体,在Qt窗口中详解复现对应的Demo
  • 使用Cloudflare的AI Gateway代理Google AI Studio
  • 论文阅读:Code as Policies: Language Model Programs for Embodied Control
  • Redis的单线程和多线程
  • Linux_用 `ps` 按进程名过滤线程,以及用 `pkill` 按进程名安全杀进程
  • 记一次RocketMQ消息堆积
  • (二十二)深入了解AVFoundation-编辑:视频变速功能-实战在Demo中实现视频变速
  • 数字人视频创作革命!开源免费无时限InfiniteTalk ,数字人图片 + 音频一键生成无限长视频
  • ADC-工业信号采集卡-K004规格书
  • 智能电视MaxHub恢复系统
  • 【第十章】Python 文件操作深度解析:从底层逻辑到多场景实战​
  • Flink 滑动窗口实战:从 KeyedProcessFunction 到 AggregateFunction WindowFunction 的完整旅程
  • vi/vim 查找字符串
  • h5和微信小程序查看pdf文件
  • 实验1 第一个微信小程序
  • Linux学习-TCP网络协议(补充)
  • 贝叶斯方法和朴素贝叶斯算法
  • tcpdump学习
  • 20250825的学习笔记
  • 2025年09月计算机二级Java选择题每日一练——第七期
  • 配置单区域 OSPF
  • 集群与集群概念
  • 自动修改excel 自动统计文件名称插入 excel辅助工具
  • 升级openssh后ORACLE RAC EM 安装失败处理