Python基础知识(IO编程)
目录
- 1.文件读写
- 1.1.读文件
- 1.2.字符编码
- 1.3.二进制文件
- 1.4.写文件
- 2.操作文件和目录
- 2.1.环境变量
- 2.2.操作文件、目录
1.文件读写
读写文件是Python语言最常见的IO操作。通过数据盘读写文件的功能都是由操作系统提供的,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。
1.1.读文件
首先举例子,以读的模式获取文件里的内容,如下:
f = open(f"D:\\www\python_project\\Conda\\test_python\\test.txt", 'r')
f参数为文件对象句柄,其中r
标识代表以只读模式进行获取,通过该对象可以进行读取文件内容,如下:
f.read()
一次性读取全部。分行读取:
for line in f.readlines():print(line)
如果文件不存在,open()函数就会抛出一个IOError的错误,详细的信息告诉你文件不存在:
Traceback (most recent call last):File "D:\www\python_project\Conda\test_python\test1.py", line 2, in <module>f = open(f"D:\\www\python_project\\Conda\\test_python\\test.txt1", 'r')
FileNotFoundError: [Errno 2] No such file or directory: 'D:\\www\\python_project\\Conda\\test_python\\test.txt1'
最后一步是调用close()方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的:
f.close()
涉及io操作,文件读写时都有可能产生IOError,一旦出错,后面的f.close()就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,一般通过使用try … finally来实现:
try:f = open(f'D:\\www\python_project\\Conda\\test_python\\test.txt', 'r')print(f.read())
finally:if f:f.close()
或者通过简化的写法实现:
with open(f'D:\\www\python_project\\Conda\\test_python\\test.txt, 'r') as f:print(f.read())
这样的写法节省了f.close(),同时也满足即使抛出了异常也能够自己关闭文件对象句柄。
1.2.字符编码
读取带有编码文件的内容,如要读取非UTF-8编码的文本文件,需要给open()函数传入encoding参数,读取GBK编码的文件:
with open(f'D:\\www\python_project\\Conda\\test_python\\test.txt', 'r', encoding="GBK") as f:print(f.read())
默认情况下不传则代表读取UTF-8编码的文件。
1.3.二进制文件
前面讲的默认都是读取文本文件,并且是UTF-8编码的文本文件。要读取二进制文件,比如图片、视频等等,这些类型的用’rb’模式打开文件即可:
with open(f"D:\\www\\python_project\\Conda\\test_python\\timg.jpg", "rb") as f:print(f.read())
打印出的结果是:
b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x01\'
类似上面这种结果,实际结果内容太多,我截图了一部分,让大家能够看到是这个样子的内容即可。
1.4.写文件
写文件和读文件是一样的,唯一区别是调用open()函数时,传入标识符’w’或者’wb’表示写文本文件或写二进制文件:
f = open(f'D:\\www\python_project\\Conda\\test_python\\test.txt', 'w', encoding='UTF-8')
f.write("小明")
f.close()
但是这种写法是文件内容全覆盖的写法,如果想追加,可通过如下写法:
f = open(f'D:\\www\python_project\\Conda\\test_python\\test.txt', 'a+', encoding='UTF-8')
f.write("小花")
f.close()
此时文件内容为:
小明小花
2.操作文件和目录
如果我们要操作文件、目录,可以在命令行下面输入操作系统提供的各种命令来完成。比如dir、cp等命令。
如果要在Python程序中执行这些目录和文件的操作怎么办?其实操作系统提供的命令只是简单地调用了操作系统提供的接口函数,Python内置的os模块也可以直接调用操作系统提供的接口函数。
2.1.环境变量
在操作系统中定义的环境变量,全部保存在os.environ这个变量中,可以直接查看
import os
print(os.environ)
打印输出内容为:
environ({'ALLUSERSPROFILE': 'C:\\ProgramData', 'APPCODE_VM_OPTIONS'})
若想要获取某个环境变量值,则通过:
ALLUSERSPROFILE = os.environ.get("ALLUSERSPROFILE")
print(ALLUSERSPROFILE)
打印输出内容为:
C:\ProgramData
2.2.操作文件、目录
# 查看当前目录的绝对路径:
os.path.abspath('.')
'D:\www\python_project\Conda\test_python'
# 在某个目录下创建一个新目录,首先把新目录的完整路径表示出来:
os.path.join('D:\www\python_project\Conda\test_python', 'test')
'D:\www\python_project\Conda\test_python\test'
# 然后创建一个目录:
os.mkdir('D:\www\python_project\Conda\test_python\test')
把两个路径合成一个时,不要直接拼字符串,而要通过os.path.join()函数,这样可以正确处理不同操作系统的路径分隔符。在Linux/Unix/Mac下,os.path.join()返回这样的字符串:
part-1/part-2
而Windows下会返回这样的字符串:
part-1\part-2
同样的道理,要拆分路径时,也不要直接去拆字符串,而要通过os.path.split()函数,这样可以把一个路径拆分为两部分,后一部分总是最后级别的目录或文件名:
os.path.split('/Users/michael/testdir/file.txt')
('/Users/michael/testdir', 'file.txt')
os.path.splitext()可以直接让你得到文件扩展名,很多时候非常方便:
os.path.splitext('/path/to/file.txt')
('/path/to/file', '.txt')
这些合并、拆分路径的函数并不要求目录和文件要真实存在,它们只对字符串进行操作。
但是复制文件的函数居然在os模块中不存在!原因是复制文件并非由操作系统提供的系统调用。理论上讲,我们通过上一节的读写文件可以完成文件复制,只不过要多写很多代码。
最后看看如何利用Python的特性来过滤文件。比如我们要列出当前目录下的所有目录,只需要一行代码:
[x for x in os.listdir('.') if os.path.isdir(x)]
['.idea', 'venv']
[x for x in os.listdir('.') if os.path.isfile(x) and os.path.splitext(x)[1]=='.py']
['main.py', 'test.py', 'test1.py']