当前位置: 首页 > news >正文

宁波哪个公司建网站福建专业网站建设欢迎咨询

宁波哪个公司建网站,福建专业网站建设欢迎咨询,精品网站建设需要多少钱,做网站怎建立ftp和数据库Apriori算法是经典的关联规则挖掘算法,用于从事务型数据库中发现频繁项集和强关联规则,特别常用于购物篮分析等场景。 🧠 核心思想(Apriori原则) 一个项集是频繁的,前提是它的所有子集也必须是频繁的。 即&…

Apriori算法是经典的关联规则挖掘算法,用于从事务型数据库中发现频繁项集和强关联规则,特别常用于购物篮分析等场景。


🧠 核心思想(Apriori原则)

一个项集是频繁的,前提是它的所有子集也必须是频繁的。
即:“若某项集不频繁,它的超集也一定不频繁”

这个原则用于大大减少候选项集的数量,提高挖掘效率。


🚶 Apriori算法执行步骤

下面是算法流程(以最小支持度为前提):

① 扫描数据库,找出所有频繁1项集(L1)

  • 统计每个单个商品出现的次数

  • 丢掉那些支持度小于最小阈值的项

② 生成候选2项集(C2),计算频繁2项集(L2)

  • 将L1中的元素两两组合成C2

  • 扫描数据库计算这些组合的支持度

  • 保留满足最小支持度的组合,得到L2

③ 使用 L2 构造 C3,找出 L3……

  • 重复步骤直到没有更多频繁项集为止

④ 基于频繁项集生成关联规则

  • 从每个频繁项集中拆分出可能的规则A⇒B

  • 计算这些规则的置信度和提升度

  • 筛选满足置信度和提升度阈值的规则


✅ 示例(简化版)

事务如下:

事务ID商品列表
T1牛奶, 面包
T2牛奶, 尿布, 啤酒
T3面包, 尿布, 可乐
T4牛奶, 面包, 尿布
T5面包, 啤酒

最小支持度设为 0.4(2次出现)

  1. L1:频繁1项集:{牛奶}, {面包}, {尿布}, {啤酒} ✅({可乐}只出现1次,删除)

  2. C2(候选2项集):组合上面频繁1项集,比如 {牛奶, 面包}, {尿布, 啤酒} 等

  3. L2:选出支持度 ≥0.4 的组合,如 {牛奶, 面包}, {尿布, 啤酒}(若满足)

  4. L3:组合L2项集再继续下去……

  5. 对频繁项集,如 {牛奶, 尿布} 生成关联规则:

    • 例如 牛奶 ⇒ 尿布,计算置信度 = 支持(牛奶和尿布) / 支持(牛奶)


📦 应用场景

  • 零售行业的购物篮分析

  • 推荐系统(推荐某个商品时同时推荐相关联商品)

  • 医疗诊断中发现药物组合

  • Web日志分析(用户点击路径)


好的!下面是使用 Python 和 mlxtend 库来实现 Apriori 算法的完整示例。这个库简洁高效,适合教学和实践。


✅ 步骤一:安装依赖(如尚未安装)

pip install mlxtend

✅ 步骤二:准备事务数据

我们使用“啤酒与尿布”的经典示例:

import pandas as pd
from mlxtend.preprocessing import TransactionEncoder# 示例数据
dataset = [['牛奶', '面包'],['牛奶', '尿布', '啤酒'],['面包', '尿布', '可乐'],['牛奶', '面包', '尿布'],['面包', '啤酒']
]# 转换为0/1编码的DataFrame
te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
print(df)

输出:

     啤酒    可乐     尿布     牛奶    面包
0  False  False  False   True   True
1   True  False   True   True  False
2  False   True   True  False   True
3  False  False   True   True   True
4   True  False  False  False   True

✅ 步骤三:使用 Apriori 算法找出频繁项集

from mlxtend.frequent_patterns import apriori# 设定最小支持度为0.4(即至少2次)
frequent_itemsets = apriori(df, min_support=0.4, use_colnames=True)
print(frequent_itemsets)

输出示例:

   support     itemsets
0      0.6       {面包}
1      0.6       {尿布}
2      0.6       {牛奶}
3      0.4       {啤酒}
4      0.4     {牛奶, 面包}
5      0.4     {牛奶, 尿布}
6      0.4     {尿布, 面包}

✅ 步骤四:生成关联规则

from mlxtend.frequent_patterns import association_rules# 使用置信度最小值筛选规则
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.6)
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

输出示例:

  antecedents consequents  support  confidence  lift
0      {牛奶}       {面包}     0.4        0.67   1.11
1      {面包}       {牛奶}     0.4        0.67   1.11
2      {牛奶}       {尿布}     0.4        0.67   1.11

✅ 总结

  • 频繁项集 通过 apriori() 计算,保留支持度高的组合;

  • 关联规则 通过 association_rules() 生成,评估置信度、提升度等;

  • 可调整 min_supportmin_threshold 控制挖掘深度。


http://www.dtcms.com/a/460199.html

相关文章:

  • 北京营销型网站建设公司网页设计与制作模板图
  • 番禺建设网站网站建设销售总结
  • 注册营业执照网站东莞大朗网络推广外包
  • 网站推广的技能筹划电子商务网站建设
  • 企业网站文化建设长沙网站seo优化
  • 学网站建设工作室软件开发外包公司有哪些
  • 电商网站开发文档手机免费自助建站系统
  • 做一个手机网站成本物流网站建设工作岗位
  • 中建国际建设有限公司网站排版网站推荐
  • 河南开元建设有限公司网站深圳燃气公司地址
  • 高端品牌网站建设优势做网站比较大的公司
  • 怎么做网站埋点手机怎么自己制作网页
  • 餐厅网站建设汽配外贸怎么找客户
  • 建湖做网站有没有专门做名片的网站
  • 有哪些做笔译的网站网站备案为什么要闭站
  • 最好的网站建设报价建设网站有哪些问题
  • 怎么知道网站的ftpseo优化啥意思
  • 网站宣传的方法主要有wordpress中文分词
  • 超大网站制作素材wordpress 检测404
  • 贸易网站开发wordpress 转发
  • 服务器除了做网站还能做什么千万不要去苏州打工
  • 海宁高端高端网站设计1元建网站
  • 专业网站建设网站价格wordpress 运行效率
  • 我的网站打不开长沙市建设局官方网站
  • 可信赖的手机网站设计淄博网站优化资讯
  • 珠海建设网站的公司阳江市建设局网站
  • 临沂市建设安全管理网站网站建设开发公司地址
  • 国外做二手服装网站网站制作教程步骤
  • 单位加强网站建设百度小说app
  • 苏州城乡建设局的网站首页怎样做百度口碑推广自己的网站