当前位置: 首页 > news >正文

【数据挖掘笔记】兴趣度度量Interest of an association rule

        在数据挖掘中,关联规则挖掘是一个重要的任务。兴趣度度量是评估关联规则的重要指标,以下是三个常用的兴趣度度量:支持度、置信度和提升度。

支持度(Support)

计算方法

支持度表示包含项集的事务占总事务的比例,用于衡量项集的普遍性。其计算公式为:

 

对于关联规则 X→Y,其支持度计算公式为

含义及理解

        支持度反映了项集或关联规则在整个数据集中的出现频率,用于衡量实用性,简单来说就是出现的越频繁,说明越实用。就好比明星粉丝越多,说明他在群众中收到的支持就越大,有一天他逃难收到的帮助可能性就越大。

置信度(Confidence)

计算方法

        置信度表示在包含前项 X 的事务中,同时包含后项 Y 的比例,用于衡量关联规则的可靠性。其计算公式为:

含义及理解

置信度反映了关联规则的可信程度。本质上是条件概率,满足条件下得到结果的可靠性。

提升度(Lift)

计算方法

        提升度表示关联规则中前项和后项之间的关联强度,用于衡量关联规则的关联性。其计算公式为:

含义及理解

        提升度反映了关联规则中前项和后项之间的关联程度。但是很显然这太抽象了,有没有更通俗易懂的理解呢主包?有的!比如你买茶和咖啡,买茶后买咖啡的概率是0.75,但是单独买咖啡的概率是0.9,提升度就小于1,因为大家本来就爱买咖啡,但是买茶之后买咖啡的人数比例还减少了,说明喝茶的人中有一部分人发现了喝咖啡不健康,所以那部分人少了,所以买茶人群中的买咖啡比例才会从0.9减少到了0.75。

  • 如果提升度大于1,说明前项和后项之间存在正关联,即前项的出现会增加后项出现的可能性;
  • 如果提升度小于1,说明前项和后项之间存在负关联,即前项的出现会降低后项出现的可能性;
  • 如果提升度等于1,说明前项和后项之间相互独立,没有关联。
http://www.dtcms.com/a/192010.html

相关文章:

  • FastAPI使用@app.get/@app.post等装饰器注册路由无效404 Not Found
  • Kotlin并发请求的一些知识记录
  • 掌握Multi-Agent实践(七):基于AgentScope分布式模式实现多智能体高效协作[并行加速大模型辅助搜索、分布式多用户协同辩论赛]
  • 详细分析python 中的deque 以及和list 的用法区别
  • 【深度剖析】安踏体育的数字化转型(上篇1)
  • 嵌入式学习的第二十一天-数据结构-双向链表
  • js关于number类型的计算问题
  • RabbitMQ工作流程及使用方法
  • c/c++消息队列库RabbitMQ的使用
  • 动态库和静态库的区别
  • 以项目的方式学QT开发(二)
  • 哲学物理:太极图和莫比乌斯环有什么关系?
  • OkHttp用法-Java调用http服务
  • 【Linux系列】Linux 系统下 SSD 磁盘识别
  • 【油藏地球物理正演软件ColchisFM】基于数据驱动的油藏参数叠前地震反演研究进展
  • 操作系统学习笔记第3章 内存管理(灰灰题库)
  • javaSE.QueueDeque
  • python打卡打印26
  • Git 常用命令详解
  • 进程替换讲解
  • 【day01】 Chroma 核心操作流程
  • IT系统的基础设施:流量治理、服务治理、资源治理,还有数据治理。
  • 部署安装jenkins.war(2.508)
  • 练习小项目2:今日幸运颜色生成器
  • 【ALINX 实战笔记】FPGA 大神 Adam Taylor 使用 ChipScope 调试 AMD Versal 设计
  • 在Angular中使用Leaflet构建地图应用
  • 一招解决Tailwindcss4.x与其他库样式冲突问题
  • Scrapy框架下地图爬虫的进度监控与优化策略
  • 16.2 VDMA视频转发实验之模拟源
  • [Java实战]Spring Boot 3实现 RBAC 权限控制(二十五)