当前位置：首页 > news >正文

Python高阶函数-filter

news 2025/10/22 14:54:49

在这里插入图片描述

1. 基本概念

filter() 是Python内置的高阶函数，用于过滤序列中的元素。它接收一个函数和一个可迭代对象作为参数，返回一个迭代器，包含使函数返回True的所有元素。

filter(function, iterable)

2. 工作原理

惰性计算：filter对象是迭代器，只有在真正需要值时才会进行计算
筛选机制：对iterable中的每个元素应用function，保留返回值为True的元素

等价实现：

(item for item in iterable if function(item))

3. 使用示例

3.1 基础用法

# 过滤偶数
numbers = [1, 2, 3, 4, 5, 6]
even = filter(lambda x: x % 2 == 0, numbers)
print(list(even))  # 输出: [2, 4, 6]

3.2 使用None作为函数

# 过滤掉假值（False, 0, '', None等）
values = [0, 1, False, 2, '', 3]
filtered = filter(None, values)
print(list(filtered))  # 输出: [1, 2, 3]

3.3 复杂过滤条件

# 过滤包含特定字符的字符串
words = ["apple", "banana", "cherry", "date"]
result = filter(lambda w: 'a' in w and len(w) > 5, words)
print(list(result))  # 输出: ['banana']

4. 底层实现分析

CPython中的filter实现（简化版）：

typedef struct {
    PyObject_HEAD
    PyObject *func;
    PyObject *it;
} filterobject;

创建filter对象时不会立即执行计算
迭代时调用__next__()方法才会应用过滤函数

5. 性能考虑

内存效率：比列表推导式更节省内存（返回迭代器而非列表）
执行效率：对于大型数据集，filter通常比循环+条件判断更快

比较基准：

# filter vs 列表推导式
%timeit list(filter(lambda x: x%2, range(10**6)))
%timeit [x for x in range(10**6) if x%2]

6. 最佳实践

对于简单条件，考虑使用生成器表达式
复杂过滤逻辑时使用filter更清晰

需要多次使用结果时转换为列表：

filtered_list = list(filter(func, iterable))

结合其他高阶函数使用：

from functools import reduce
result = reduce(lambda x, y: x+y, filter(lambda n: n>0, numbers))

7. 常见问题

Q1: filter和列表推导式如何选择？

选择filter当：
- 已有现成的判断函数
- 需要惰性求值
- 代码可读性更重要
选择列表推导式当：
- 条件简单
- 需要立即得到结果列表

Q2: filter对象可以重复使用吗？
不可以，filter对象是迭代器，消费后即耗尽。如需重复使用，需转换为列表或重新创建。

Q3: 如何处理filter中的异常？

def safe_filter(x):
    try:
        return x > 0
    except Exception:
        return False

result = filter(safe_filter, potentially_bad_data)

8. 扩展应用

8.1 多条件过滤

def multi_filter(x):
    conditions = [
        x > 0,
        isinstance(x, int),
        x % 3 == 0
    ]
    return all(conditions)

8.2 链式过滤

data = range(100)
pipeline = filter(lambda x: x > 50, 
                 filter(lambda x: x % 2 == 0, data))

8.3 配合itertools使用

from itertools import filterfalse
# 获取不满足条件的元素
result = filterfalse(lambda x: x%2, range(10))

9. 总结

filter()是函数式编程的重要工具，合理使用可以：

使代码更声明式
提高内存效率
方便组合多个操作
提升复杂过滤逻辑的可读性

查看全文

http://www.dtcms.com/a/117758.html

es 原生linux部署集群

JS 中html的document

MySQL学习笔记六

Python爬虫生成CSV文件的完整流程

谷歌洽谈租赁英伟达AI服务器：算力争夺战再升级

过剩与稀缺：现代社会的思考与启示

信息系统项目管理师-第十一章-项目成本管理

R语言：气象水文领域的数据分析与绘图利器

属性修改器 (AttributeModifier)

2024年已备案大模型发展趋势分析

spring boot + Prometheus + Grafana 实现项目监控

2️⃣ Coze创建智能体教学（2025年全新版本）

探索轻量高性能的 Rust HTTP 服务器框架 —— Hyperlane

内存管理及内建函数

AI芯片混战：GPU vs TPU vs NPU的算力与能效博弈

嵌入式软硬件开发，常见通信总线

Spring启示录、概述、入门程序以及Spring对IoC的实现

Spring Boot 框架注解：@ConfigurationProperties

Java文件流操作 - 【Guava】IO工具

React 列表与 Keys 的深入探讨

聊聊Spring AI的PgVectorStore

OpenCV 图形API（17）计算输入矩阵 src 中每个元素的平方根函数sqrt()

oklink js逆向（入口定位）

1.2 测试设计阶段：打造高质量的测试用例

c++ 函数后面加const 作用

kaggle竞赛——房价预测

轨迹预测Physical Plausibility-aware Trajectory Prediction via Locomotion Embodiment

基于 Vue 3 + html2canvas 实现网页任意区域截图组件

抓wifi无线空口包之Ubuntu抓包（二）

Linux-CentOS-7—— 安装MySQL 8