Python 处理 CSV 和 Excel 文件的全面指南
CSV与Excel文件简介
CSV(逗号分隔值)和Excel是两种常见的数据存储格式。CSV是一种纯文本格式,以逗号分隔字段,适合简单的数据交换;而Excel支持多工作表、公式和复杂格式,适用于更复杂的表格处理。在Python中,csv模块可直接读写CSV文件,例如:
import csv
with open('data.csv', 'r') as f:reader = csv.reader(f)for row in reader:print(row)
然而,Python标准库不支持直接处理Excel文件,需借助第三方库如openpyxl或pandas。Python因其丰富的库和简洁语法,成为处理这类文件的理想工具。无论是数据清洗还是自动化处理,Python都能高效完成任务。
使用 Python 处理 CSV 文件
Python 的 csv 模块提供了读写 CSV 文件的功能。CSV(逗号分隔值)是一种常见的数据格式,广泛用于数据交换和存储。该模块包含 csv.reader 和 csv.writer 类,分别用于读取和写入 CSV 数据。
读取 CSV 文件
使用 csv.reader 可以逐行读取 CSV 文件。默认情况下,它使用 Excel 风格的格式(即逗号作为分隔符)。如果文件使用其他格式,如制表符或 Unix 格式,可以通过 dialect 参数指定。
import csvwith open('data.csv', 'r') as file:reader = csv.reader(file)for row in reader:print(row)
写入 CSV 文件
使用 csv.writer 可以将数据写入 CSV 文件。同样支持通过 dialect 参数指定格式。
import csvdata = [['姓名', '年龄'],['张三', '25'],['李四', '30']
]with open('output.csv', 'w', newline='') as file:writer = csv.writer(file)writer.writerows(data)
使用 dialects
csv.list_dialects() 可查看所有可用的 dialects,例如 'excel', 'unix' 等。这些格式定义了分隔符、引号等规则,适用于不同系统的 CSV 文件。
import csv
print(csv.list_dialects())
