当前位置：首页 > news >正文

Pandas数据处理与分析实战:Pandas数据处理与分析入门-选择与过滤

news 2025/8/13 8:21:55

数据选择与过滤：Pandas数据处理入门

学习目标

本课程将帮助学员掌握使用Pandas库从DataFrame中选择特定的行和列，以及如何根据条件过滤数据。通过本课程的学习，学员将能够灵活地处理和分析数据，为更复杂的数据分析任务打下坚实的基础。

学习内容

1 使用Pandas进行数据选择与过滤

1.1 选择特定的行和列

在数据处理中，经常需要从数据集中选择特定的行或列。Pandas提供了多种方法来实现这一目标，包括使用标签、位置和布尔索引等。

1.1.1 使用标签选择

Pandas中的DataFrame对象支持使用标签来选择数据。标签可以是列名或行索引。例如，假设我们有一个包含学生信息的数据集，包括姓名、年龄和成绩等字段。

import pandas as pd# 创建一个示例DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],'Age': [23, 25, 22, 24],'Score': [88, 92, 78, 85]
}
df = pd.DataFrame(data)# 选择特定的列
names = df['Name']
print(names)# 选择多个列
name_age = df[['Name', 'Age']]
print(name_age)

输出：

0     Alice
1       Bob
2    Charlie
3     David
Name: Name, dtype: objectName  Age
0  Alice   23
1    Bob   25
2  Charlie  22
3   David  24

1.1.2 使用位置选择

除了使用标签，Pandas还支持使用位置来选择数据。iloc方法允许我们通过行和列的位置来选择数据。

print(df)
print("==================")
# 选择特定的行
first_row = df.iloc[0]
print(first_row)
print("==================")
# 选择多个行
first_two_rows = df.iloc[:2]
print(first_two_rows)
print("==================")
# 选择特定的行和列
first_two_names = df.iloc[:2, 0]
print(first_two_names)

输出：

Name      Alice
Age          23
Score        88
Name: 0, dtype: objectName  Age  Score
0  Alice   23     88
1    Bob   25     920     Alice
1       Bob
Name: Name, dtype: object

1.2 条件过滤

在实际数据处理中，我们经常需要根据某些条件来过滤数据。Pandas提供了强大的布尔索引功能，可以轻松实现这一目标。

1.2.1 单一条件过滤

假设我们想要选择所有年龄大于23岁的学生。

# 选择年龄大于23岁的学生
older_students = df[df['Age'] > 23]
print(older_students)

输出：

    Name  Age  Score
1     Bob   25     92
3   David   24     85

1.2.2 多条件过滤

我们还可以使用多个条件来过滤数据。例如，选择年龄大于23岁且成绩大于85分的学生。

# 选择年龄大于23岁且成绩大于85分的学生
older_high_score_students = df[(df['Age'] > 23) & (df['Score'] > 85)]
print(older_high_score_students)

输出：

Name  Age  Score
1  Bob   25     92

1.3 复合条件过滤

在某些情况下，我们可能需要使用更复杂的条件来过滤数据。Pandas支持使用逻辑运算符（如&、|、~）来组合多个条件。

1.3.1 使用逻辑运算符

假设我们想要选择年龄大于23岁或成绩大于90分的学生。

# 选择年龄大于23岁或成绩大于90分的学生
older_or_high_score_students = df[(df['Age'] > 23) | (df['Score'] > 90)]
print(older_or_high_score_students)

输出：

Name  Age  Score
1     Bob   25     92
3   David   24     85

1.3.2 使用`isin`方法

isin方法可以用来检查某个列的值是否在给定的列表中。例如，选择名字为Alice或Bob的学生。

# 选择名字为Alice或Bob的学生
selected_students = df[df['Name'].isin(['Alice', 'Bob'])]
print(selected_students)

输出：

    Name  Age  Score
0  Alice   23     88
1    Bob   25     92

通过本课程的学习，学员已经掌握了如何使用Pandas从DataFrame中选择特定的行和列，以及如何根据条件过滤数据。这些技能将帮助学员在数据处理和分析中更加得心应手。希望学员在实际项目中能够灵活运用这些知识，提高数据处理的效率和准确性。

查看全文

http://www.dtcms.com/a/327844.html

uniapp -- 小程序处理与设备通讯 GBK/GB2312 编码问题。

记一次 .NET 某汽车控制焊接软件卡死分析

腾讯云terraform学习教程

传输线的效应

【MAUI】在 .NET MAUI 中实现全局异常捕获的完整指南

五、Nginx、RabbitMQ和Redis在Linux中的安装和部署

DAY41 简单CNN

PostgreSQL——数据查询

PyCharm Community 2024.2.3.exe 安装教程（详细步骤，附安装包下载）

Docker守护进程安全加固在香港VPS环境的操作标准

vue3使用插槽写一个自定义瀑布列表

海康视觉相机驱动软件参数配置

用 Docker 安装并启动 MySQL：从零到实战的完整指南

vivo Pulsar 万亿级消息处理实践(2)-从0到1建设 Pulsar 指标监控链路

人工智能与金融：金融行业的革新

计算机网络摘星题库800题笔记第3章数据链路层

linux Phy驱动开发之mido总线介绍

打印流水号标签

三防手机和防爆手机的本质区别是什么？

INSAR数据处理---ENVI5.6(Sarscape）

【从零开始java学习|第三篇】变量与数据类型的关联

秋招笔记-8.9

【网络运维】Linux和自动化： Ansible基础实践

SynAdapt：通过合成连续思维链实现大语言模型的自适应推理

机器学习第十课之TF-IDF算法（红楼梦文本分析）

服务器节点技术解析：从架构原理到家庭实践的全维度指南

文件IO函数实现

异或和查询

【报错处理】mount: /boot/efi: unknown filesystem type ‘LVM2_member‘.

ARM基础概念异常处理01 day52

Pandas数据处理与分析实战:Pandas数据处理与分析入门-选择与过滤

数据选择与过滤：Pandas数据处理入门

学习目标

相关知识点

学习内容

1 使用Pandas进行数据选择与过滤

1.1 选择特定的行和列

1.1.1 使用标签选择

1.1.2 使用位置选择

1.2 条件过滤

1.2.1 单一条件过滤

1.2.2 多条件过滤

1.3 复合条件过滤

1.3.1 使用逻辑运算符

1.3.2 使用`isin`方法

相关文章：

数据选择与过滤：Pandas数据处理入门

学习目标

相关知识点

学习内容

1 使用Pandas进行数据选择与过滤

1.1 选择特定的行和列

1.1.1 使用标签选择

1.1.2 使用位置选择

1.2 条件过滤

1.2.1 单一条件过滤

1.2.2 多条件过滤

1.3 复合条件过滤

1.3.1 使用逻辑运算符

1.3.2 使用isin方法

相关文章：

1.3.2 使用`isin`方法