当前位置: 首页 > wzjs >正文

网站假设公司排名网络营销项目策划

网站假设公司排名,网络营销项目策划,wordpress 多站点 插件,怎么做游戏代理一、数据挖掘定义 数据挖掘: 从大量的数据中挖掘那些令人感兴趣的、有用的、隐含的、先前未知的 和可能有用的 模式或知识 ,并据此更好的服务人们的生活。 二、四类任务 数据分析有哪些任务? 今天我们来讲述其中的关联分析 三、关联分析 典…

一、数据挖掘定义

数据挖掘:
从大量的数据中挖掘那些令人感兴趣的、有用的、隐含的、先前未知的
和可能有用的 模式或知识 ,并据此更好的服务人们的生活。

二、四类任务

数据分析有哪些任务?

今天我们来讲述其中的关联分析

三、关联分析

典型例子:啤酒与尿布

常用方法 —— 关联规则挖掘 (Association Rule Mining)

        给出事务的集合, 能够发现一些规则:𝐴 => 𝐵

        当事务中某些子项出现时,预测其他子项也出现

基本概念:

Association Rule(关联规则)

    形如X → Y的表达式,X, Y均为项集

    例:{Milk, Diaper} →{Beer}

Confidence (置信度)

    度量包含X的事务中同时出现Y的频率

    例:对于关联规则{Milk, Diaper} →{Beer}

    confidence({Milk, Diaper} →{Beer})= 2/3

强关联规则

    用户自行设定最小置信度阈值min _conf,置信度大于min _conf的规则称为强关联规则

    例:设min _conf = 0.5,则{Milk, Diaper} →{Beer}为强关联规则

四、APriori算法

生成频繁项集

核心思想:广度优先搜索,自底而上遍历,逐步生成候选集与频繁项集

反单调性原理:如果一个项集是频繁的,则它的所有子集一定也是频繁

成立原因:

        ∀X, Y: X ⊆ Y → Support X ≥ Support(Y)

        依据该性质,对于某k+1项集,只要存在一个k项子集不是频繁项集, 则可以直接判定该项集不是频繁项集

 

算法步骤

        连接步:从频繁 K-1 项集生成候选K项集

        剪枝步:从候选 K 项集筛选出频繁K项集

举个例子:

下图为某商店的用户购买记录,共有9个事务,A-Priori假定事务中的项按字典次序存放。

(1) 在算法的第一次迭代,每个项都是候选1项集的集合C_1的成员。算法简单地扫描所有的事务,对每个项的出现次数计数

(2) 设最小支持度计数=2,可以确定频繁1项集的集合L_1

(3) 使用L1⋈ L1产生候选2项集的集合C_2

(4) 扫描数据集,计算C_2中每个候选项集的支持度

(5)最小支持度计数=2,确定频繁2项集的集合L_2

(6) 使用L2⋈ L2产生候选3项集的集合C_3

(7) 扫描数据集,计算C_3中每个候选项集的支持度

(8)最小支持度计数=2,确定频繁3项集的集合L_3

(9) 使用L3⋈ L3产生候选4项集的集合C4,尽管连接产生结果 \{l_1, l_2, l_3, l_5\} ,这个项集被

剪去,因为它的子集 \{l_2, l_3, l_5\}不是频繁的。则C4 = ∅ ,因此算法终止,找出了所有的

频繁项集如下

五、生成规则

关联规则挖掘的第二步:如何从频繁项集中生成规则?

若{A,B,C,D}是频繁项集, 候选规则有14种:

ABC →D, ABD →C, ACD →B, BCD →A,

A →BCD,B →ACD, C →ABD, D →ABC

AB →CD,AC → BD, AD → BC, BC →AD,BD →AC, CD →AB,

|L| = k, 则有2^k- 2 种候选的关联规则(忽略L → \phi\phi → L)

关联规则生成(Rule Generation)—— 计算复杂度

对于d个项目:

候选项集数= 2^d

可能规则数R = 3^d-2^{d+1}+1

六、辛普森悖论

相关关系≠因果关系,但相关关系的背后可能蕴含着某种因果

例如,公鸡打鸣 → 太阳升起,从关联规则角度来说,是高置信度规则,说明“公鸡打鸣 ”与“太阳升起”很相关,但并不是因果关系

第二个实例:

适当的数据分层有助于避免辛普森悖论


下一讲,我们将讲述分类和预测

http://www.dtcms.com/wzjs/1926.html

相关文章:

  • 双鸭山网站开发设计网站
  • 做教师知识网站有哪些内容谷歌seo怎么优化
  • jsp简述网站开发流程图爱站网关键词长尾挖掘
  • 毕业设计做网站选题国家域名注册服务网
  • wordpress禁止缩略图百度点击优化
  • 上海市城乡建设和管理委员会网站怎样推广公司的网站
  • 国内房地产设计网站建设重庆发布的最新消息今天
  • 高品质的网站开发公电商运营一天都干啥
  • 建网站找那家企业好互联网营销工具
  • 高手优化网站优化seo厂家
  • 360浏览器怎么创建网页seo关键词如何布局
  • 做网站遇到竞争对手怎么办百度软件商店下载安装
  • 移动端页面长沙网站托管seo优化公司
  • 郑州疫情严重程度百度seo在哪里
  • 影视网站建设方案北京seo推广外包
  • 网站建设与管理维护 李建青专业培训seo的机构
  • 淘宝1688批发网官网免费发seo外链平台
  • 网站教人做核能灯互联网营销师怎么考
  • 长沙行业网站建设考研培训机构排名
  • 网站开发接口文档模板seo网站优化助理
  • 做检测设备的网站有哪些百度站长seo
  • 1核1g可以做几个网站手机端怎么刷排名
  • 做伊瑞尔竞技场的网站小程序定制
  • 可信赖的南昌网站制作百度seo关键词优化软件
  • 页面跳转的方式有哪些微软优化大师
  • 易优cms和织梦cms的区别湖南企业seo优化
  • 制作微网站公司seo关键词排名技巧
  • 做网站需要准备资料网站优化seo怎么做
  • 深圳市企业网站建设企业b站推广网站入口2023的推广形式
  • 餐饮门户网站 方案怎么做网站优化资源