当前位置：首页 > wzjs >正文

运动猿app 网站开发免费模版网

wzjs 2025/9/13 3:18:40

运动猿app 网站开发,免费模版网,网站优化检测响应速度,网站开发技术项目说明书Pandas 数据检索技术全面指南 1. 引言 Pandas 是 Python 数据分析的核心库，提供了高效便捷的数据检索功能。无论是简单的条件筛选还是复杂的分组聚合，Pandas 都能优雅地处理。本文将详细介绍 Pandas 的各种数据检索技术，并通过实际代码示例…

Pandas 数据检索技术全面指南

1. 引言

Pandas 是 Python 数据分析的核心库，提供了高效便捷的数据检索功能。无论是简单的条件筛选还是复杂的分组聚合，Pandas 都能优雅地处理。本文将详细介绍 Pandas 的各种数据检索技术，并通过实际代码示例展示其强大功能。

2. 基础条件查询

2.1 布尔索引

最基本的条件查询方式是使用布尔索引：

import pandas as pd# 创建示例数据
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],'Age': [25, 30, 35, 40, 45],'Salary': [50000, 60000, 70000, 80000, 90000]}
df = pd.DataFrame(data)# 选择年龄大于30的记录
result = df[df['Age'] > 30]
print(result)

解释：

df['Age'] > 30 返回一个布尔 Series
将这个布尔 Series 作为索引传入 DataFrame，会返回所有值为 True 的行

2.2 多条件组合

可以使用 & (与)、| (或)、~ (非) 组合多个条件：

# 选择年龄大于30且工资小于80000的记录
result = df[(df['Age'] > 30) & (df['Salary'] < 80000)]
print(result)# 选择年龄小于30或大于40的记录
result = df[(df['Age'] < 30) | (df['Age'] > 40)]
print(result)

注意：每个条件必须用括号括起来，因为运算符优先级问题。

3. query() 方法

query() 方法提供了一种更简洁的条件查询方式：

3.1 基本查询

# 使用query方法选择年龄大于30的记录
result = df.query('Age > 30')
print(result)

3.2 多条件查询

# 选择年龄大于30且工资小于80000的记录
result = df.query('Age > 30 and Salary < 80000')
print(result)# 使用or条件
result = df.query('Age < 30 or Age > 40')
print(result)

3.3 使用变量查询

# 定义变量
min_age = 30
max_salary = 80000# 在query中使用变量
result = df.query('Age > @min_age and Salary < @max_salary')
print(result)

优点：

语法更简洁
可以直接使用列名而不需要重复写df[]
支持使用外部变量（需要加@前缀）

4. 分组聚合查询

4.1 groupby() 基础

# 创建包含部门的示例数据
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],'Department': ['HR', 'IT', 'HR', 'IT', 'Finance'],'Salary': [50000, 60000, 70000, 80000, 90000]}
df = pd.DataFrame(data)# 按部门分组并计算平均工资
result = df.groupby('Department')['Salary'].mean()
print(result)

输出：

Department
Finance    90000
HR        60000
IT        70000
Name: Salary, dtype: int64

4.2 多重分组

# 添加更多数据
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva', 'Frank'],'Department': ['HR', 'IT', 'HR', 'IT', 'Finance', 'Finance'],'Gender': ['F', 'M', 'M', 'M', 'F', 'M'],'Salary': [50000, 60000, 70000, 80000, 90000, 85000]}
df = pd.DataFrame(data)# 按部门和性别分组，计算平均工资
result = df.groupby(['Department', 'Gender'])['Salary'].mean()
print(result)

输出：

Department  Gender
Finance     F         90000M         85000
HR          F         50000M         70000
IT          M         70000
Name: Salary, dtype: int64

4.3 聚合函数

可以同时应用多个聚合函数：

# 按部门分组，对工资应用多个聚合函数
result = df.groupby('Department')['Salary'].agg(['mean', 'max', 'min', 'count'])
print(result)

输出：

          mean    max    min  count
Department                         
Finance   87500  90000  85000      2
HR        60000  70000  50000      2
IT        70000  80000  60000      2

5. 透视表 (pivot_table)

透视表是强大的数据汇总工具，可以看作是高级版的分组聚合。

5.1 基本透视表

# 创建透视表，计算各部门的平均工资
result = pd.pivot_table(df, values='Salary', index='Department', aggfunc='mean')
print(result)

5.2 多维度透视表

# 按部门和性别计算平均工资
result = pd.pivot_table(df, values='Salary', index='Department', columns='Gender', aggfunc='mean')
print(result)

输出：

Gender         F      M
Department             
Finance   90000  85000
HR        50000  70000
IT          NaN  70000

5.3 多重聚合函数

# 对同一数据应用多个聚合函数
result = pd.pivot_table(df, values='Salary', index='Department', aggfunc=['mean', 'max', 'min', 'count'])
print(result)

5.4 填充缺失值和汇总

# 添加margins参数显示总计
result = pd.pivot_table(df, values='Salary', index='Department', columns='Gender', aggfunc='mean',margins=True,margins_name='Total')
print(result)

输出：

Gender         F      M   Total
Department                     
Finance   90000  85000  87500
HR        50000  70000  60000
IT          NaN  70000  70000
Total    70000  75000  72500

6. 高级检索技巧

6.1 isin() 方法

# 选择特定部门的员工
departments = ['HR', 'Finance']
result = df[df['Department'].isin(departments)]
print(result)

6.2 between() 方法

# 选择工资在60000到80000之间的员工
result = df[df['Salary'].between(60000, 80000)]
print(result)

6.3 str 访问器

# 选择名字以A开头的员工
result = df[df['Name'].str.startswith('A')]
print(result)# 选择名字包含a的员工（不区分大小写）
result = df[df['Name'].str.contains('a', case=False)]
print(result)

7. 性能优化技巧

7.1 使用query()提高性能

对于大型DataFrame，query()通常比布尔索引更快：

# 创建大型DataFrame
import numpy as np
large_df = pd.DataFrame({'A': np.random.rand(1000000),'B': np.random.rand(1000000)})# 比较两种方法的性能
%timeit large_df[(large_df['A'] > 0.5) & (large_df['B'] < 0.5)]
%timeit large_df.query('A > 0.5 and B < 0.5')

7.2 使用eval()进行表达式求值

# 使用eval计算新列
df.eval('Bonus = Salary * 0.1', inplace=True)
print(df)

8. 总结

布尔索引是最基础的条件查询方式，适合简单条件筛选
query()方法提供了更简洁的语法，特别适合复杂条件查询
分组聚合(groupby) 是数据分析的核心操作，可以按不同维度汇总数据
透视表(pivot_table) 提供了更灵活的多维数据汇总能力
高级检索技巧如isin(), between(), str访问器等可以处理更复杂的查询需求
性能优化技巧如query()和eval()可以提升大数据集的处理效率

Pandas提供了丰富而强大的数据检索功能，掌握这些技术可以显著提高数据分析的效率和灵活性。根据具体场景选择合适的方法，可以写出既高效又易读的代码。

希望这篇指南能帮助你更好地利用Pandas进行数据检索和分析！

文章转载自：

http://pQ994M16.nnwnL.cn
http://nCQGksW4.nnwnL.cn
http://QvleHPs2.nnwnL.cn
http://ojqmVOe7.nnwnL.cn
http://uC9mrt7Y.nnwnL.cn
http://K4Y4tY6B.nnwnL.cn
http://KYVTNw15.nnwnL.cn
http://fgJzYhsW.nnwnL.cn
http://Okvc4P3Y.nnwnL.cn
http://h5gEOT7m.nnwnL.cn
http://fXurvouQ.nnwnL.cn
http://PlgNYsq4.nnwnL.cn
http://rn6sNB82.nnwnL.cn
http://tFA0RiQx.nnwnL.cn
http://yiOlUh4N.nnwnL.cn
http://uVL7nG6I.nnwnL.cn
http://Deo7xxFL.nnwnL.cn
http://ac1hnPUr.nnwnL.cn
http://nqEwjby7.nnwnL.cn
http://lj7fecrx.nnwnL.cn
http://h7B0Dv38.nnwnL.cn
http://eAj5iuvK.nnwnL.cn
http://UIT4QvJ0.nnwnL.cn
http://IBNhTuGw.nnwnL.cn
http://e3SUJ3Dt.nnwnL.cn
http://75dE32Dk.nnwnL.cn
http://GUGSv9gO.nnwnL.cn
http://27yNxynm.nnwnL.cn
http://B1cjDpI8.nnwnL.cn
http://oph5iekS.nnwnL.cn

查看全文

http://www.dtcms.com/wzjs/712632.html

爱站网ip反查域名北京海淀建设部邮编

北京专业网站营销张家口专业做网站公司

你做的网站会不会被人模仿网站如何自己做优化

做网站能接到项目工程吗上海长宁建设和交通门户网站

移动端网站开发项目报告华为商城官网手机版

网站的投票系统怎么做工业设计专业怎么样

新开传奇网站刚开一秒第一区宁波好的seo外包公司

做网站开公司男科医院和正规医院哪家好

大良网站设计价格wordpress code theme

保险网站有哪些网站要钱怎么

如何优化网站结构十堰城市建设网站

如何给网站配色谁做彩票网站代理

网站优化的意义怎么使用电脑是做网站

克拉玛依市建设局网站wordpress 微博模板

网站做推广怎么收费建设游戏网站需要哪些设备

建设工作室网站网站建设开题报告书

网站标题关键词描述深圳创业补贴咨询电话

怎么看一个网站是否是外包做的destoon做的网站

网站如何添加图标我想建设一个算命网站

上海空灵网站设计北京装修公司哪家口碑最好知乎

不用下载就能看的网站的浏览器高性能网站建设书籍

网站开发定义名称网站占有率

国际英文网站广州网站搭建快速提升网站排名

济南做网站公司wordpress 会员中心插件

荣成市城乡建设局网站创建网页用什么软件

定制版网站建设详细报价单网站建设解决方案

虚拟主机做网站wordpress3.7.1下载

大良网站建设如何网站备案初审时间

拍卖网站功能需求文档wordpress 文字插件下载

免费素材网站素材库简单的网页设计论文