当前位置: 首页 > news >正文

【project】--数据挖掘

挑选数据集

在这里插入图片描述

在这里插入图片描述

使用python模块导入数据集

在这里插入图片描述

导入数据集

from ucimlrepo import fetch_ucirepo # fetch dataset 
# 数据集--NATICUSdroid(Android 权限)
naticusdroid_android_permissions = fetch_ucirepo(id=722) # data (as pandas dataframes)# 数据特征
X = naticusdroid_android_permissions.data.features 
# 目标数据
y = naticusdroid_android_permissions.data.targets # metadata
# 打印数据集的元数据信息
# 元数据包含了关于数据集的一些基本描述,例如数据集的名称、来源、创建时间、数据类型等
# 这些信息有助于我们更好地理解数据集的背景和特点
print(naticusdroid_android_permissions.metadata) # variable information
# 打印数据集中变量的信息
# 变量信息会详细描述数据集中每个特征和目标变量的含义、数据类型、取值范围等
# 这对于我们了解数据集的结构和特征非常有帮助
print(naticusdroid_android_permissions.variables) 

查看数据集

#查看数据规模
print(f"样本数量:{X.shape[0]},特征数量:{X.shape[1]}")
#查看目标变量分布
print("\n目标变量分布:")
#检查y的列名
#y.columns
print (y['Result']. value_counts(normalize=True))
# 查看变量信息表的列名
print(naticusdroid_android_permissions.variables.columns.tolist())
http://www.dtcms.com/a/184197.html

相关文章:

  • Docker 部署 - Crawl4AI 文档 (v0.5.x)
  • 【TI MSPM0】CCS工程管理
  • 【LwIP源码学习6】UDP部分源码分析
  • 研修室智慧化升级实践:线上预约+智能门锁的融合方案
  • 高级数据结构:线段树
  • Problem B: 面向对象综合题2
  • LLM框架
  • 【Diffusion】在华为云ModelArts上运行MindSpore扩散模型教程
  • 基于SpringBoot的抽奖系统测试报告
  • 11、参数化三维产品设计组件 - /设计与仿真组件/parametric-3d-product-design
  • Linux-TCP套接字编程简易实践:实现EchoServer与远程命令执行及自定义协议(反)序列化
  • 基于物联网的智能家居监控系统设计和实现(源码+论文+部署讲解等)
  • OpenWrt开发第8篇:树莓派开发板做无线接入点
  • 计算机网络笔记(二十一)——4.3IP层转发分组的过程
  • 小土堆pytorch--torchvision中的数据集的使用dataloader的使用
  • 在python中,为什么要引入事件循环这个概念?
  • 第二十三节:图像金字塔- 图像金字塔应用 (图像融合)
  • 封装和分用(网络原理)
  • 【常用算法:排序篇】4.高效堆排序:线性建堆法与蚂蚁问题的降维打击
  • Kafka的基本概念和Dokcer中部署Kafka
  • B 端电商数据接口开发:1688 商品详情页实时数据抓取技术解析
  • 组合模式(Composite Pattern)详解
  • Docker拉取ubuntu22.04镜像使用ROS2 humble及仿真工具可视化进行导航
  • [案例四] 智能填写属性工具(支持装配组件还有建模实体属性的批量创建、编辑)
  • NoSQL数据库技术与应用复习总结【看到最后】
  • MySQL为什么选择B+树
  • MCP:重塑AI交互的通用协议,成为智能应用的基础设施
  • JUC并发编程(上)
  • Qt—多线程基础
  • 《Redis应用实例》学习笔记,第一章:缓存文本数据