# 文件的编码
# 文件编码定义
- 编码技术:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别的内容
- 不同编码,将内容翻译成二进制是不同的,常见编码有 UTF-8,GBK,Big5
- 编码就是一种规则集合,记录了内容和二进制进行相互转换的逻辑
# 文件的读取
# 文件介绍
- 内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U 盘等设备。为了便于数据的管理和检索,引入了 “文件” 的概念
- 一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别
# 文件操作
文件操作主要包括打开、关闭、读、写等操作
# open () 打开函数
在 Python,使用 open 函数,可以打开一个已经存在的文件,或者创建一个新文件
| open(name, mode, encoding) |
- name:是要打开的目标文件名的字符串(可以包含文件所在具体路径)
- mode:设置打开文件的模式(访问模式):只读、写入、追加等
- encoding:编码格式
| f = open("python.txt", "r", encoding="UTF-8") |
mode 常用三种基础访问模式
模式 |
描述 |
r |
以只读方式打开文件,文件的指针回放在文件开头,默认模式 |
w |
打开一个文件只用于写,如果该文件已经存在则打开文件,并从开头开始编辑,原有内容会被删除,文件不存在,则创建新文件 |
a |
打开一个文件用于追加,如果文件已存在,新的内容将会被写入到已有内容之后,如果不存在,则创建新文件 |
# 读取文件方法
# read () 方法
num 表示要从文件中读取的数据的长度,如果没有传入 num,那么就表示读取文件中所有数据
# readlines () 方法
readlines 可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素
| f = open("python.txt", "r", encoding="UTF-8") |
| content = f.readlines() |
| print(content) |
| f.close() |
# readline () 方法
一次读取一行数据
| f = open("python.txt", "r", encoding="UTF-8") |
| content = f.readline() |
| print(content) |
| f.close() |
# for 循环读取文件
| for line in open("python.txt", "r", encoding="UTF-8"): |
| print(line) |
| |
# close () 关闭文件对象
| f = open("python.txt", "r", encoding="UTF-8") |
| f.close() |
| |
| |
# with open 语法
| with open("python.txt", "r", encoding="UTF-8") as f: |
| f.readlines() |
| |
| |
# 文件的写入
| f = open("python.txt", "w", encoding="UTF-8") |
| f.write("hello world") |
| f.flush() |
- 直接调用 write,内容并未真正写入文件,而是会积攒到程序内存中,称之为缓冲区
- 当调用 flush 的时候,内容将会真正写入文件
- 这样做是避免频繁的操作硬盘,导致效率下降
- 文件如果不存在,使用 "w" 模式,会创建新文件
- 文件如果存在,使用 "w" 模式,会将原有内容覆盖
# 文件的追加
| f = open("python.txt", "a", encoding="UTF-8") |
| f.write("hello world") |
| f.flush() |
- a 模式:文件不存在时会创建文件
- a 模式:文件存在 hi 在最后,追加写入文件'
- 可以使用 "\n" 来写出换行符