当前位置: 首页 > wzjs >正文

做网站如何不被忽悠国际新闻界官网

做网站如何不被忽悠,国际新闻界官网,软件公司的税收优惠政策,郑州个人网站建设这里继续 机器学习-人与机器生数据的区分模型测试-数据处理1的内容 查看数据 中1的情况 #查看数据1的分布情况 one_ratio_list [] for col in data.columns:if col city or col target or col city2: # 跳过第一列continueelse:one_ratio data[col].mean() # 计算1值占…

这里继续 机器学习-人与机器生数据的区分模型测试-数据处理1的内容

查看数据 中1的情况

#查看数据1的分布情况
one_ratio_list = []
for col in data.columns:if col == 'city' or col == 'target' or col == 'city2':  # 跳过第一列continueelse:one_ratio = data[col].mean()  # 计算1值占比print(f"{col}: {one_ratio}")one_ratio_list.append(one_ratio)plt.figure(figsize=(8,4))
sns.histplot(one_ratio_list, bins=20, kde=True)
plt.title('Histogram of 1-Value Proportion Distribution')
plt.xlabel('Proportion of 1 value')
plt.show()

可以看每个区间的具体分布
在这里插入图片描述

应用Apriori算法挖掘频繁项集

查看数据组合有没有意义

# 数据预处理管道
def preprocess_for_apriori(data):"""对输入的数据进行预处理,使其适合 Apriori 算法。Apriori 算法要求输入数据为二元数据(仅包含 0 和 1)。参数:data (pandas.DataFrame): 输入的原始数据,需要转换为适合 Apriori 算法的格式。返回:pandas.DataFrame: 经过预处理的二元数据,仅包含有效二元字段。"""# 类型转换与验证# 将输入数据转换为整数类型,确保数据为数值型data_binary = data.astype(int)# 过滤无效字段# 找出所有元素仅为 0 或 1 的列,Apriori 算法要求输入为二元数据valid_cols = data_binary.columns[data_binary.isin([0,1]).all()]# 从转换后的二进制数据中选取有效列data_valid = data_binary[valid_cols]# 最终验证# 确保处理后的数据至少有一个有效二元字段,若没有则抛出异常assert data_valid.shape[1] > 0, "无有效二元字段可用"return data_valid

执行数据预处理

try:data_preprocessed = preprocess_for_apriori(data_clean)print(f"有效字段数量: {len(data_preprocessed.columns)}")# Apriori算法执行frequent_itemsets = apriori(data_preprocessed, min_support=0.05,use_colnames=True,low_memory=True)  # 启用内存优化if not frequent_itemsets.empty:print("Top10高频组合:")print(frequent_itemsets.sort_values('support', ascending=False).head(10))else:print("未找到满足支持度的频繁项集,尝试降低min_support值")except Exception as e:print("处理失败:", str(e))# 逐步降低阈值测试  
for support in [0.05, 0.03, 0.01]:  frequent_itemsets = apriori(data_preprocessed, min_support=support)  if not frequent_itemsets.empty:  print(f"min_support={support}时找到项集")  break  

数据组合没有想的那么好。
在这里插入图片描述

http://www.dtcms.com/wzjs/100173.html

相关文章:

  • 泰安房产网站建设南宁网站建设公司
  • 哈尔滨建站公司外链平台有哪些
  • 怎么做网站实惠百度员工收入工资表
  • 游戏网站建设的必要性百度推广登陆入口官网
  • 网站正在建设中html5seo技术公司
  • 企业自建服务器网站建设流程黑龙seo网站优化
  • 淄博外贸网站建设公司关键词全网指数查询
  • 武汉光谷网站建设百度推广河南总部
  • 中国十大网站建设公司郑州做网站公司排名
  • 自己做网站模版高端企业网站建设
  • 泰安手机网站建设搭建一个网站平台需要多少钱
  • 凡科做网站不要钱兰州网站seo诊断
  • 网站制作的软件重庆自动seo
  • 提供网站制作公司报价网站市场推广
  • 怎么注册自己的微网站外贸平台
  • 网站建设两个方面网站页面禁止访问
  • 财务咨询网站模板营销课程培训哪个机构好
  • 怎样做自己的公司网站百度官网登录
  • 郑州自建网站网络促销
  • 哪种nas可以做网站服务器网络营销公司是做什么的
  • 镇江做网站多少钱网店怎么推广和宣传
  • 西安市建设建委网站武汉网络关键词排名
  • 饭店餐厅网站建设推广联系方式
  • 钟祥网站建设如何制作简单的网页链接
  • 郑州医疗网站建设网络推广员是干嘛的
  • 做网站需准备些什么问题佣金高的推广平台
  • 小程序游戏排行榜2023兰州网络推广优化服务
  • 成人网站vps北京搜索引擎优化主管
  • 西安php网站制作百度有几种推广方式
  • wordpress怎么新建子域名廊坊百度关键词优化怎么做