学习Python第13天
周日玩嗨了,周一上班头贼痛,还好今天没什么活,摸了一天鱼。
汇报一下秋招进度,上周字节和阿里一面,和面试官聊的都挺好的,面试官也说了不论通不通过都会邮件通知,但这都一周了,还没给我发邮件,难道泡池子了?本周美团一面,加油!已经两周没投递简历了,目前就投了十几家大厂,流程推进贼慢。还想投点外企,过两天研究研究怎么投,今天早点下班躺尸。
今日任务:
CSV
读取CSV文件
df = pd.read_csv()
import pandas as pd# 读取 CSV 文件,并自定义列名和分隔符
df = pd.read_csv('data.csv', sep=';', header=0, names=['A', 'B', 'C'], dtype={'A': int, 'B': float})#输出的结果为数据的前五行和后五行,中间以...省略
print(df)#返回DaraFrame类型的数据
print(df.to_string())
参数说明:
参数 | 说明 | 默认值 |
---|---|---|
filepath_or_buffer | CSV 文件的路径或文件对象(支持 URL、文件路径、文件对象等) | 必需参数 |
sep | 定义字段分隔符,默认是逗号(, ),可以改为其他字符,如制表符(\t ) | ',' |
header | 指定行号作为列标题,默认为 0(表示第一行),或者设置为 None 没有标题 | 0 |
names | 自定义列名,传入列名列表 | None |
index_col | 用作行索引的列的列号或列名 | None |
usecols | 读取指定的列,可以是列的名称或列的索引 | None |
dtype | 强制将列转换为指定的数据类型 | None |
skiprows | 跳过文件开头的指定行数,或者传入一个行号的列表 | None |
nrows | 读取前 N 行数据 | None |
na_values | 指定哪些值应视为缺失值(NaN) | None |
skipfooter | 跳过文件结尾的指定行数 | 0 |
encoding | 文件的编码格式(如 utf-8 ,latin1 等) | None |
写入CSV
df.to_csv()
import pandas as pd# 假设 df 是一个已有的 DataFrame
df.to_csv('output.csv', index=False, header=True, columns=['A', 'B'])
参数说明:
参数 | 说明 | 默认值 |
---|---|---|
path_or_buffer | CSV 文件的路径或文件对象(支持文件路径、文件对象) | 必需参数 |
sep | 定义字段分隔符,默认是逗号(, ),可以改为其他字符,如制表符(\t ) | ',' |
index | 是否写入行索引,默认 True 表示写入索引 | True |
columns | 指定写入的列,可以是列的名称列表 | None |
header | 是否写入列名,默认 True 表示写入列名,设置为 False 表示不写列名 | True |
mode | 写入文件的模式,默认是 w (写模式),可以设置为 a (追加模式) | 'w' |
encoding | 文件的编码格式,如 utf-8 ,latin1 等 | None |
line_terminator | 定义行结束符,默认为 \n | None |
quoting | 设置如何对文件中的数据进行引号处理(0-3,具体引用方式可查文档) | None |
quotechar | 设置用于引用的字符,默认为双引号 " | '"' |
date_format | 自定义日期格式,如果列包含日期数据,则可以使用此参数指定日期格式 | None |
doublequote | 如果为 True ,则在写入时会将包含引号的文本使用双引号括起来 | True |
刷刷题去