当前位置: 首页 > news >正文

【project】--数据挖掘

挑选数据集

在这里插入图片描述

在这里插入图片描述

使用python模块导入数据集

在这里插入图片描述

导入数据集

from ucimlrepo import fetch_ucirepo # fetch dataset 
# 数据集--NATICUSdroid(Android 权限)
naticusdroid_android_permissions = fetch_ucirepo(id=722) # data (as pandas dataframes)# 数据特征
X = naticusdroid_android_permissions.data.features 
# 目标数据
y = naticusdroid_android_permissions.data.targets # metadata
# 打印数据集的元数据信息
# 元数据包含了关于数据集的一些基本描述,例如数据集的名称、来源、创建时间、数据类型等
# 这些信息有助于我们更好地理解数据集的背景和特点
print(naticusdroid_android_permissions.metadata) # variable information
# 打印数据集中变量的信息
# 变量信息会详细描述数据集中每个特征和目标变量的含义、数据类型、取值范围等
# 这对于我们了解数据集的结构和特征非常有帮助
print(naticusdroid_android_permissions.variables) 

查看数据集

#查看数据规模
print(f"样本数量:{X.shape[0]},特征数量:{X.shape[1]}")
#查看目标变量分布
print("\n目标变量分布:")
#检查y的列名
#y.columns
print (y['Result']. value_counts(normalize=True))
# 查看变量信息表的列名
print(naticusdroid_android_permissions.variables.columns.tolist())

相关文章:

  • Docker 部署 - Crawl4AI 文档 (v0.5.x)
  • 【TI MSPM0】CCS工程管理
  • 【LwIP源码学习6】UDP部分源码分析
  • 研修室智慧化升级实践:线上预约+智能门锁的融合方案
  • 高级数据结构:线段树
  • Problem B: 面向对象综合题2
  • LLM框架
  • 【Diffusion】在华为云ModelArts上运行MindSpore扩散模型教程
  • 基于SpringBoot的抽奖系统测试报告
  • 11、参数化三维产品设计组件 - /设计与仿真组件/parametric-3d-product-design
  • Linux-TCP套接字编程简易实践:实现EchoServer与远程命令执行及自定义协议(反)序列化
  • 基于物联网的智能家居监控系统设计和实现(源码+论文+部署讲解等)
  • OpenWrt开发第8篇:树莓派开发板做无线接入点
  • 计算机网络笔记(二十一)——4.3IP层转发分组的过程
  • 小土堆pytorch--torchvision中的数据集的使用dataloader的使用
  • 在python中,为什么要引入事件循环这个概念?
  • 第二十三节:图像金字塔- 图像金字塔应用 (图像融合)
  • 封装和分用(网络原理)
  • 【常用算法:排序篇】4.高效堆排序:线性建堆法与蚂蚁问题的降维打击
  • Kafka的基本概念和Dokcer中部署Kafka
  • 中华人民共和国和巴西联邦共和国关于强化携手构建更公正世界和更可持续星球的中巴命运共同体,共同维护多边主义的联合声明
  • 北京航空航天大学首个海外创新研究院落户巴西
  • 习近平举行仪式欢迎巴西总统卢拉访华
  • 刘国中:持续加强护士队伍建设,更好保障人民身体健康
  • 马上评丨摆摊要交芙蓉王?对吃拿卡要必须零容忍
  • 《新时代的中国国家安全》白皮书(全文)