当前位置: 首页 > news >正文

【Pandas】pandas DataFrame eval

Pandas2.2 DataFrame

Computations descriptive stats

方法描述
DataFrame.abs()用于返回 DataFrame 中每个元素的绝对值
DataFrame.all([axis, bool_only, skipna])用于判断 DataFrame 中是否所有元素在指定轴上都为 True
DataFrame.any(*[, axis, bool_only, skipna])用于判断 DataFrame 中是否至少有一个元素在指定轴上为 True
DataFrame.clip([lower, upper, axis, inplace])用于截断(限制)DataFrame 中的数值
DataFrame.corr([method, min_periods, …])用于计算 DataFrame 中各列之间的相关系数矩阵(Correlation Matrix)
DataFrame.corrwith(other[, axis, drop, …])用于计算当前 DataFrame 的每一列(或行)与另一个 Series 或 DataFrame 中对应列的相关系数
DataFrame.count([axis, numeric_only])用于统计 DataFrame 中每列或每行的非空(非 NaN)元素数量
DataFrame.cov([min_periods, ddof, numeric_only])用于计算 DataFrame 中每对列之间的协方差
DataFrame.cummax([axis, skipna])用于计算 DataFrame 中每列或每行的累计最大值(cumulative maximum)
DataFrame.cummin([axis, skipna])用于计算 DataFrame 中每列或每行的累计最小值(cumulative minimum)
DataFrame.cumprod([axis, skipna])用于计算 DataFrame 中每列或每行的累计乘积(cumulative product)
DataFrame.cumsum([axis, skipna])用于计算 DataFrame 中每列或每行的累计和(cumulative sum)
DataFrame.describe([percentiles, include, …])用于快速生成数据集的统计摘要(summary statistics)
DataFrame.diff([periods, axis])用于计算 DataFrame 中相邻行或列之间的差值(差分)
DataFrame.eval(expr, *[, inplace])用于在 DataFrame 上下文中高效地执行字符串形式的表达式运算

pandas.DataFrame.eval()

pandas.DataFrame.eval() 方法用于在 DataFrame 上下文中高效地执行字符串形式的表达式运算。它允许你使用类似 Python 表达式的语法(如 +, -, *, /, 比较符等)来操作 DataFrame 的列,而无需显式调用 Pandas 函数或创建临时变量。

该方法特别适用于简化复杂表达式、节省内存和提高计算效率。


📌 方法签名:
DataFrame.eval(expr, *, inplace=False)

🧾 参数说明:
参数类型描述
exprstr要计算的表达式字符串,例如 'A + B', 'C > 5', 'D = A * B' 等。支持大多数 Python 运算符和部分 NumPy 函数。
inplacebool, 默认 False如果为 True,则将结果赋值回原 DataFrame(仅当 expr 是赋值语句时有效)。

📊 返回值:
  • expr 是表达式(非赋值),返回一个 Series 或标量;
  • expr 是赋值语句且 inplace=True,则修改原 DataFrame 并返回 None
  • 否则返回一个新的 DataFrame。

✅ 示例及结果:
示例1:基本表达式计算
import pandas as pddf = pd.DataFrame({'A': [1, 2, 3],'B': [4, 5, 6]
})# 计算 A + B
result = df.eval('A + B')
print(result)
输出结果:
0    5
1    7
2    9
dtype: int64

示例2:比较表达式
# 判断 A 是否大于 B
result = df.eval('A > B')
print(result)
输出结果:
0    False
1    False
2    False
dtype: bool

示例3:创建新列(不修改原 DataFrame)
# 计算并返回新 DataFrame,包含新增列 C = A * B
new_df = df.eval('C = A * B')
print(new_df)
输出结果:
   A  B   C
0  1  4   4
1  2  5  10
2  3  6  18

示例4:使用 inplace=True 修改原 DataFrame
# 将新列 D = A + B 添加到原 DataFrame
df.eval('D = A + B', inplace=True)
print(df)
输出结果:
   A  B   D
0  1  4   5
1  2  5   7
2  3  6   9

示例5:使用局部变量(通过 @ 符号引用)
scale = 2
result = df.eval('A + B * @scale')
print(result)
输出结果:
0     9
1    12
2    15
dtype: int64

示例6:逻辑组合表达式
# 复杂条件判断
result = df.eval('(A < 2) & (B > 4)')
print(result)
输出结果:
0    False
1     True
2    False
dtype: bool

🎯 适用场景:
场景描述
特征工程快速构造新特征,如 X = A + B, Y = log(C)
数据清洗条件筛选、布尔索引前的逻辑构建
性能优化相比普通 Pandas 操作更高效,尤其对大数据集
代码简洁性替代冗长的表达式写法,提升可读性

⚠️ 注意事项:
  • 只能访问当前 DataFrame 中的列名;
  • 使用 @ 前缀可以引用外部变量;
  • 不支持复杂的控制流语句(如 if/for);
  • 对于赋值表达式,推荐使用 inplace=True 避免中间变量;
  • 不会自动处理字符串列,只适用于数值型数据;

📋 总结:
特性描述
功能执行字符串表达式进行列间运算
默认行为返回新 Series 或 DataFrame
是否修改原数据可通过 inplace=True 控制
适用类型数值型列(int、float)
优势更快、更简洁、节省内存

eval() 是一个非常强大的工具,适合在数据预处理、特征工程和快速探索分析中使用。

相关文章:

  • CertiK助力以太坊扩展战略,解析Pectra升级的变革与挑战
  • 5G + 区块链:技术巨浪下的新型数字生态!
  • 数字孪生工厂实战指南:基于Unreal Engine/Omniverse的虚实同步系统开发
  • 如何使用WordPress SEO检查器进行实时内容分析
  • 【OpenGL学习】(一)创建窗口
  • 边缘计算平台
  • Unity光照笔记
  • 如何使用 Google Gemini API 和 Python 从航行情报通告 (NOTAM) 中提取结构化空域信息
  • RiDoc:高效文档扫描与图像处理工具,助力高效办公
  • mavgenerate 在 win11 下环境搭建注意问题
  • Top-p采样:解锁语言模型的创意之门
  • Redis--基础知识点--27--redis缓存分类树
  • 【AI论文】用于评估和改进大型语言模型中指令跟踪的多维约束框架
  • K8S Gateway API 快速开始、胎教级教程
  • AD 区域规则(Room规则)的设置
  • Mac 环境下 JDK 版本切换全指南
  • C#中的typeof操作符与Type类型:揭秘.NET反射的基础
  • React和Vue在前端开发中, 通常选择哪一个
  • 全面指南:Xinference大模型推理框架的部署与使用
  • 6大核心记忆方法
  • 物流网站怎么做/营销策划方案ppt模板
  • 设计师服务平台鱼巴士官网/河南网站seo
  • 墙绘做网站推广有作用没/淘宝联盟怎么推广
  • 做app还是做网站合适6/游戏推广是什么工作
  • 汕头网站网站建设/柳州网站建设
  • 南宁电子推广网站/深圳百度推广seo公司