当前位置：首页 > news >正文

Python之文件操作详解

news 2025/9/24 21:55:21

前言

一、文件操作基础

1、打开文件

2、关闭文件

二、读取文件

1、读取全部内容

2、逐行读取

3、读取所有行到列表

三、写入文件

1、写入字符串

2、写入多行

2.1、常见使用场景

2.2、注意事项与常见错误

2.3、高级用法

2.4、性能对比

2.5、最佳实践总结

3、追加写入

四、文件指针操作

五、二进制文件操作

六、实际工作场景中的常见代码示例

1、日志文件处理（按条件过滤）

2、CSV数据清洗（处理缺失值）

3、大文件分块读取（内存优化）

4、配置文件解析（JSON/YAML）

5、文件监控（实时处理新内容）

6、多文件合并（归并处理）

前言

最近在学习Python，将所学内容整理成文章，以便以后翻阅和复习，同时分享给大家。有问题欢迎随时指正。

一、文件操作基础

1、打开文件

open(file_path, mode, encoding)

file_path：文件路径，可以是相对路径或绝对路径。
mode：打开模式，常用模式包括：

模式	描述
`r`	只读（默认）
`w`	写入（覆盖原文件）
`a`	追加写入
`x`	创建新文件并写入
`b`	二进制模式（如 `rb`, `wb`）
`+`	读写模式（如 `r+`, `w+`）

# 示例：打开文件（推荐使用 with 自动管理资源）
with open('example.txt', 'r', encoding='utf-8') as f:
    content = f.read()

2、关闭文件

close()

# 手动打开并关闭文件（不推荐，容易忘记关闭）
f = open('demo.txt', 'w', encoding='utf-8')
f.write('Hello World')
f.close()  # 必须显式关闭

对比with语句（推荐方式）

# 使用 with 自动关闭（最佳实践）
with open('demo.txt', 'w') as f:
    f.write('Auto-closed file')

# 等效于：
f = open('demo.txt', 'w')
try:
    f.write('Auto-closed file')
finally:
    f.close()

实际场景中的关闭必要性

# 案例：文件未关闭导致写入失败
def write_data():
    f = open('data.txt', 'w')
    f.write('Important data')
    # 忘记 f.close() → 数据可能仍在缓冲区未写入磁盘

# 正确写法：
def safe_write():
    with open('data.txt', 'w') as f:
        f.write('Saved data')  # with 块结束自动关闭并写入磁盘

# 立即读取刚写入的内容
with open('data.txt', 'w') as f:
    f.write('Test')
    
with open('data.txt', 'r') as f:  # 必须重新打开才能读取新内容
    print(f.read())  # 输出 Test

二、读取文件

1、读取全部内容

read()

with open('example.txt', 'r') as f:
    data = f.read()  # 返回整个文件内容的字符串

2、逐行读取

readline()

with open('example.txt', 'r') as f:
    line = f.readline()  # 读取一行
    while line:
        print(line.strip())  # 去除末尾换行符
        line = f.readline()

3、读取所有行到列表

with open('example.txt', 'r') as f:
    lines = f.readlines()  # 返回包含所有行的列表
    for line in lines:
        print(line.strip())

三、写入文件

1、写入字符串

write(text)

with open('output.txt', 'w') as f:
    f.write('Hello, World!\n')  # 写入内容（覆盖模式）

2、写入多行

writelines(lines)

lines = ['Line 1\n', 'Line 2\n']
with open('output.txt', 'w') as f:
    f.writelines(lines)  # 写入列表中的每行内容

2.1、常见使用场景

场景1：从其他数据源生成行

# 将数值列表转为文本行
numbers = [1, 2, 3, 4, 5]
lines = [f"数值: {n}\n" for n in numbers]

with open('data.log', 'w') as f:
    f.writelines(lines)

# 输出：
# 数值: 1
# 数值: 2
# 数值: 3
# 数值: 4
# 数值: 5

场景2：追加模式写入

# 在已有文件后追加新行
new_lines = ["追加行1\n", "追加行2\n"]

with open('existing_file.txt', 'a', encoding='utf-8') as f:
    f.writelines(new_lines)

场景3：动态生成内容

import datetime

# 生成带时间戳的日志行
timestamps = [
    f"[{datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}] 事件 {i}\n"
    for i in range(3)
]

with open('events.log', 'w') as f:
    f.writelines(timestamps)

# 输出示例：
# [2023-08-20 09:15:23] 事件 0
# [2023-08-20 09:15:23] 事件 1
# [2023-08-20 09:15:23] 事件 2

2.2、注意事项与常见错误

错误1：忘记换行符

# 错误写法：所有内容挤在一行
lines = ["内容A", "内容B", "内容C"]
with open('wrong.txt', 'w') as f:
    f.writelines(lines)  # 输出：内容A内容B内容C

# 正确写法：
lines = ["内容A\n", "内容B\n", "内容C\n"]

错误2：非字符串类型

# 错误案例：包含非字符串元素
mixed_data = ["文本\n", 123, True]
with open('error.txt', 'w') as f:
    # f.writelines(mixed_data)  # 将抛出 TypeError
    
    # 解决方案：转换为字符串
    f.writelines([str(item)+'\n' for item in mixed_data])

2.3、高级用法

方法1：配合生成器处理大文件

def generate_large_data(num_lines):
    """生成大文件数据"""
    for i in range(num_lines):
        yield f"这是第 {i+1} 行数据\n"  # 使用生成器避免内存爆炸

# 写入100万行（内存友好）
with open('bigfile.txt', 'w') as f:
    f.writelines(generate_large_data(1_000_000))

方法2：二进制模式写入

# 写入二进制换行符（Windows换行符为\r\n）
lines = [
    b"Binary line 1\r\n",
    b"Binary line 2\r\n"
]

with open('binary_file.bin', 'wb') as f:
    f.writelines(lines)