当前位置: 首页 > news >正文

一周学会Pandas2 Python数据处理与分析-Pandas2数据信息查看操作

锋哥原创的Pandas2 Python数据处理与分析 视频教程:  

2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili

DataFrame的基础信息和统计性信息。在我们拿到一 个数据集,用Pandas载入后,需要做一些初步的验证,比如行名、列名是否一致,数据量是否有缺失,各列的数据类型等,让我们对数据的全貌有所了解。 大多数功能对Series也是适用的。

查看样本信息

加载完的数据可能由于量太大,我们需要查看部分样本数据,

Pandas2提供了三个常用的样式查看方法。

  • df.head():前部数据,默认5条,可指定条数。 可指定参数,查看具体条数;

  • df.tail():尾部数据,默认5条,可指定条数。 可指定参数,查看具体条数;

  • df.sample():一条随机数据,可指定条数。

查看数据形状

执行df.shape会返回一个元组,该元组的第一个元素代表行数,第二个元素代表列数,这就是这个数据的基本形状,也是数据的大小。

查看数据类型信息

df.dtypes会返回每个字段的数据类型及DataFrame整体的类型。如果是Series,需要用s.dtype:

查看行列索引内容

df.axes会返回一个列内容和行内容组成的列表[列索引, 行索引]。

查看其他信息

还有一些比较重要的常用操作方法:

# 导入pandas库,取别名pd
import pandas as pddf = pd.read_excel('student_scores.xlsx')  # 读取excel,返回DataFrame数据集对象
print('行索引对象:', df.index)
print('列索引对象:', df.columns)
print('维度:', df.ndim)
print('数据量大小 2维的话 就是行*列:', df.size)
print('判断是否空:', df.empty)
print('列名:', df.keys())xuehao = df.get('学号')
print(xuehao, type(xuehao))
print('列名:', xuehao.name)
print('列数据:', xuehao.array)
print('类型:', xuehao.dtype)
print('是否有空值:', xuehao.hasnans)

运行输出:

行索引对象: RangeIndex(start=0, stop=100, step=1)
列索引对象: Index(['姓名', '学号', '出生日期', '性别', '语文分数', '数学分数', '英语分数'], dtype='object')
维度: 2
数据量大小 2维的话 就是行*列: 700
判断是否空: False
列名: Index(['姓名', '学号', '出生日期', '性别', '语文分数', '数学分数', '英语分数'], dtype='object')
0     S43591
1     S58574
2     S13904
3     S52393
4     S96363...  
95    S79434
96    S67323
97    S64118
98    S51652
99    S83394
Name: 学号, Length: 100, dtype: object <class 'pandas.core.series.Series'>
列名: 学号
列数据: <NumpyExtensionArray>
['S43591', 'S58574', 'S13904', 'S52393', 'S96363', 'S87321', 'S38223','S52462', 'S65981', 'S71167', 'S68359', 'S35300', 'S55657', 'S59149','S75750', 'S74263', 'S23252', 'S25195', 'S50704', 'S47635', 'S40379','S13017', 'S52519', 'S16435', 'S28971', 'S85208', 'S27585', 'S62627','S86384', 'S36721', 'S64469', 'S68648', 'S42390', 'S19317', 'S46948','S85356', 'S38109', 'S18044', 'S57329', 'S89262', 'S60195', 'S30985','S91859', 'S70895', 'S49759', 'S86490', 'S77550', 'S13767', 'S23890','S53426', 'S33910', 'S24949', 'S24148', 'S39855', 'S93799', 'S99543','S10237', 'S12998', 'S39744', 'S91052', 'S51794', 'S94066', 'S56298','S47302', 'S45130', 'S64840', 'S41290', 'S11720', 'S14390', 'S13955','S37016', 'S93213', 'S15822', 'S93938', 'S52885', 'S18974', 'S70290','S57408', 'S20641', 'S56667', 'S23756', 'S75070', 'S54227', 'S94451','S89327', 'S92720', 'S64610', 'S20017', 'S84014', 'S62573', 'S47391','S49285', 'S77596', 'S22009', 'S78314', 'S79434', 'S67323', 'S64118','S51652', 'S83394']
Length: 100, dtype: object
类型: object
是否有空值: FalseProcess finished with exit code 0

相关文章:

  • 文心一言开发指南06——千帆大模型平台新手指南
  • redis常用集合操作命令
  • 4月27日星期日今日早报简报微语报早读
  • 力扣hot100_子串_python版本
  • 8.Excel:数据验证和下拉列表
  • 大学之大:索邦大学2025.4.27
  • AI翻译LangChain实现的一点有趣思考
  • femap许可冲突
  • DLMS 协议(Green Book) —— AARQ、AARE、RLRQ、RLRE 和 Security Payload 详解
  • 日语学习-日语知识点小记-进阶-JLPT-N2阶段(9):语法单词
  • Linux命令#文件操作
  • WinForm真入门(18)——DateTimePicker‌控件解析
  • 【NVM】管理不同版本的node.js
  • Simulink与C的联合仿真调试
  • 业务校验工具包-validate-utils介绍
  • 【数据可视化-39】2009-2019年亚马逊50大畅销书数据集可视化分析
  • 【网络原理】 网络编程套接字
  • 探索排序算法的奥秘(上):冒泡排序、选择排序、插入排序
  • Babel、core-js、Loader之间的关系和作用全解析
  • 【Google Colab】利用unsloth针对医疗数据集进行大语言模型的快速微调(含跑通原代码)
  • 永辉超市回应顾客结算时被“反向抹零”:整改并补偿
  • 海南机场拟超23亿元收购美兰空港控股权,进一步聚焦机场主业
  • 人社部:一季度全国城镇新增就业308万人,同比增加5万人
  • 阿里开源首个“混合推理模型”:集成“快思考”、“慢思考”能力
  • 外交部:欢迎外国朋友“五一”来中国
  • 全球前瞻|王毅赴巴西出席金砖外长会,加拿大迎来“几十年来最重要大选”