当前位置: 首页 > news >正文

文件编码概念|文件的读取操作|文件读取的课后练习讲解

P85 文件编码概念

文件编码

思考:计算机只能识别0和1,那么我们丰富的文本文件是如何被计算机识别,并存储的硬盘中的呢?

答案:使用编码技术(密码本)将内容翻译成0和1存入。

编码技术即:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容。

如:

我👉编码👉1011

喜👉编码👉1101

欢👉编码👉1111

你👉编码👉1001

计算机中有许多可用编码:

  • UTF-8(8-bit unicode transformation format)
  • GBK
  • Big5

不同的编码,将内容翻译成二进制也是不同的。

编码有许多,所以要使用正确的编码,才能对文件进行正确的读写操作。

查看文件编码

我们可以使用Windows系统自带的记事本,打开文件后,即可看出文件的编码是什么:

UTF-8是目前全球通用的编码格式

除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可

 

P86 文件的读取操作

什么是文件

内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U盘等设备。为了便于数据的管理和检索,引入了“文件”的概念。

一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。

文件操作包含哪些内容呢?

在日常生活中,文件操作主要包括打开、关闭、读、写等操作。

文件的操作步骤

  1. 打开文件
  2. 读写文件
  3. 关闭文件

注意:可以只打开和关闭文件,不进行任何读写。

open()打开函数

在python中,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下

open(name,mode,encoding)

name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)

mode:设置打开文件的模式(访问模式):只读、写入、追加等。

encoding:编码格式(推荐使用UTF-8)

示例代码:

f=open('python.txt','r',encoding='UTF-8')
# encoding的顺序不是第三位,所以不能使用位置参数,用关键字参数直接指定

注意:此时的‘f’是‘open’函数的文件对象,对象是python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问。(老师说后面会教)

 

 

 

读操作相关方法

 

# 打开文件
f=open("D:/python.txt","r",encoding="UTF-8")
print(type(f))   # 查看f类型

read()方法:(读取指定长度字节,不指定num读取全部文件)

文件对象.read(num)

num表示要从文件中读取的数据长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

# 读取文件-read()
print(f"读取10个字节的结果是:{f.read(10)}")

f=open("D:/python.txt","r",encoding="UTF-8")
# 读取文件-read()
print(f"读取10个字节的结果是:{f.read(10)}")
print(f"读取全部内容的结果是:{f.read()}")

如果连续调用两次read函数,则第二次将会接着第一次读取的结尾内容进行读取。

readlins()方法:(读取全部行,得到列表)

readlins可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。

f=open("D:/python.txt","r",encoding="UTF-8")
# 读取文件-readlines()
lines=f.readlines()    # 读取文件的全部行,封装到列表中
print(f"lines对象的类型是:{type(lines)}")
print(f"lines对象的内容是:{lines}")

\n:换行符

readline()方法:一次读取一行内容

f=open("D:/python.txt","r",encoding="UTF-8")
line1=f.readline()
print((f"第一行:{line1}"))line2=f.readline()
print(f"第二行:{line2}")line3=f.readline()
print(f"第三行:{line3}")line4=f.readline()
print(f"第四行:{line4}")# 关闭文件
f.close()

for循环读取文件行:一次循环得到一行文件

for line in open("python.txt","r"):

        print(line)

# 每一个line临时变量,就记录了文件的一行数据

f=open("D:/python.txt","r",encoding="UTF-8")
# for循环读取文件行
for line in f:print(f"每一行数据line对象:{line}")

 

close()关闭文件对象

f=open("python.txt","r",encoding="UTF-8")

f.close()

# 最后通过close,关闭文件对象,也就是关闭对文件的占用
# 如果最后不调用close,同时程序没有停止运行,那么这个文件将一致被python程序占用。

with open 语法:打开文件,可以自动关闭

with open("python.txt","r") as f:

        f.readlines()

# 通过在with open的语句块中对文件进行操作
# 可以在操作完场后自动关闭close文件,避免遗忘掉close方法
# with open 语法操作文件啊金
with open("D:/python.txt","r",encoding="UTF-8") as f:for line in f:print(f"每一行的内容是:{line}")time.sleep(50000)

这时候python.txt可以被删除,因为with open结束后,程序会自动关闭被打开的文件(python.txt)

 

 

mode常用的三种基础访问模式

mode常用的三种基础访问模式
模式描述
r(read)以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
w(write)打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。如果该文件不存在,创建新文件。
a(append)打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

P87文件读取的课后练习讲解

 

题目:通过文件读取操作,读取此文件,统计no单词出现的次数

我写的代码:

f=open("D:/python_subject.txt","r",encoding="UTF-8")
lines=f.readlines()
# 打印python_subject.txt全部内容
print(f"读取python_subject.txt后得到:{lines}")
print()
subject_list=str(lines).split(" ")
# 打印python_subject.txt被split分割后的内容
print(f"对python_subject.txt按照空格进行切分后得到:{subject_list}")
print()
count_no=subject_list.count("no")
# 打印no出现的次数
print(f"python.subject.txt中‘no’出现了{count_no}次")

老师写的代码:

# 打开文件,以读取模式打开
f=open("D:/python_subject.txt","r",encoding="UTF-8")
# 老师写的代码
# 方式1:读取全部内容,通过字符串count方法统计no单词数量
content=f.read()
no_count=content.count("no")
print(f"'no'在python_subject.txt中出现了{no_count}次")

# 方式2:读取内容,一行一行读取
f=open("D:/python_subject.txt","r",encoding="UTF-8")
count=0
for line in f:line=line.strip()   # 去除开头和结尾的换行符words=line.split(" ")    # 对内容按照空格进行切分for word in words:if word=="no":count+=1
print(f"no在python_subject.txt中出现了{count}次")
# 判断单词出现次数并累计

 

http://www.dtcms.com/a/288944.html

相关文章:

  • 数据治理,治的是什么?
  • 0719代码调试记录
  • 【星海出品】python安装调试篇
  • 网络安全隔离技术解析:从网闸到光闸的进化之路
  • Spring Boot总结
  • RabbitMQ核心组件浅析:从Producer到Consumer
  • 深入理解设计模式:访问者模式详解
  • 深入理解浏览器解析机制和XSS向量编码
  • Java中List<int[]>()和List<int[]>[]的区别
  • React-Native开发环境配置-安装工具-创建项目教程
  • 数据并表技术全面指南:从基础JOIN到分布式数据融合
  • Pinia 核心知识详解:Vue3 新一代状态管理指南
  • 六边形滚动机器人cad【7张】三维图+设计书明说
  • [数据库]Neo4j图数据库搭建快速入门
  • 反激电源中的Y电容--问题解答
  • Python类中方法种类与修饰符详解:从基础到实战
  • linux shell从入门到精通(一)——为什么要学习Linux Shell
  • MybatisPlus-14.扩展功能-DB静态工具-练习
  • 0401聚类-机器学习-人工智能
  • VSCode中Cline无法正确读取终端的问题解决
  • Github 贪吃蛇 主页设置
  • hot100——第八周
  • 【文件IO】认识文件描述符和内核缓冲区
  • docker Neo4j
  • 【论文阅读笔记】RF-Diffusion: Radio Signal Generation via Time-Frequency Diffusion
  • Vue3虚拟滚动实战:从固定高度到动态高度,告别列表卡顿
  • 从零开始的云计算生活——番外5,使用ELK实现对应用日志的监控
  • lvs调度算法(10种)
  • 【Docker基础】Docker-compose常用命令实践(一):服务生命周期管理
  • LVS技术详解与实战