文件操作
文件操作分为读、写、修改。
一: 文件处理的三个步骤
1. 打开文件拿到文件对象(文件对象====>操作系统打开文件====>硬盘)
f=open(r'文件的路径',mode='文件的打开模式',encoding='字符编码') #绝对路径:C:\a\b\c.txt,/a/b/c/c.txt 相对路径:相对于当前执行文件所在的文件夹为起始点进行查找b/c/a.txt2. 操作文件:读/写
# f.read()# f.readlines()# f.readline()# f.readable()
3. 向操作系统发送指令关闭文件,回收操作系统资源
# f.close()
二、上下文管理
with open(r'D:\xxxx',mode='rt',encoding='utf-8') as f:# data=f.read()# print(data)# print('='*100)name=input('>>: ')for line in f:print(line)
一、 基本概念
打开文件的模式有三种纯净模式:r(默认的) w a
控制操作文件内容格式的两种模式:t(默认的) b
大前提: tb模式均不能单独使用,必须与纯净模式结合使用
t文本模式:1. 读写文件都是以字符串为单位的2. 只能针对文本文件3. 必须指定encoding参数b二进制模式:1.读写文件都是以bytes/二进制为单位的2. 可以针对所有文件3. 一定不能指定encoding参数二、打开文件模式详解
1. r只读模式: 在文件不存在时则报错,文件存在文件内指针直接跳到文件开头
# with open('a.txt',mode='rt',encoding='utf-8') as f:# print(f.readlines())
# 用户认证功能
# inp_name=input('请输入你的名字: ').strip()# inp_pwd=input('请输入你的密码: ').strip()# with open(r'db.txt',mode='rt',encoding='utf-8') as f:# for line in f:# # 把用户输入的名字与密码与读出内容做比对# u,p=line.strip('\n').split(':')# if inp_name == u and inp_pwd == p:# print('登录成功')# break# else:# print('账号名或者密码错误')
2. w只写模式: 在文件不存在时会创建空文档,文件存在会清空文件,文件指针跑到文件开头
# with open('b.txt',mode='wt',encoding='utf-8') as f:# print(f.writable())# print(f.readable())# f.write('你好\n')# f.write('我好\n') # 强调:在文件不关闭的清空下,后写的内容一定跟着前写内容的后面# f.write('大家好\n')# f.write('111\n222\n333\n') # lines=['1111','22222','33333'] # for line in lines: # f.write(line) # f.writelines(lines)
注册功能:
# name=input('username>>>: ').strip()# pwd=input('password>>>: ').strip()# with open('db1.txt',mode='at',encoding='utf-8') as f:# info='%s:%s\n' %(name,pwd)# f.write(info)
3. a只追加写模式: 在文件不存在时会创建空文档,文件存在会将文件指针直接移动到文件末尾
# with open('c.txt',mode='at',encoding='utf-8') as f:# f.write('44444\n')# f.write('55555\n')# print(f.readable())# print(f.writable())
# r+ w+ a+
# with open('a.txt',mode='r+t',encoding='utf-8') as f:# print(f.readable())# print(f.writable())# print(f.readline())# f.write('你好啊')
# b: 读写都是以二进制为单位
# with open('b.txt',mode='rb') as f:# data=f.read()# # print(data,type(data))# print(data.decode('utf-8'))# with open('1.png',mode='rb') as f:# data=f.read()# print(data)
# with open('d.txt','wb') as f:# f.write('你好'.encode('gbk'))# with open('1.png',mode='rb') as f:# data=f.read()## with open('2.png',mode='wb') as f:# f.write(data)# 拷贝工具
src_file=input('源文件路径: ').strip()dst_file=input('目标文件路径: ').strip()with open(r'%s' %src_file,mode='rb') as read_f,open(r'%s' %dst_file,mode='wb') as write_f:for line in read_f:# print(line)
须知一:
硬盘空间无法修改,硬盘中的数据更新都是用新的内容覆盖旧的内容# 内存控制可以修改
# with open('a.txt','r+t',encoding='utf-8') as f:# f.seek(4,0)# print(f.tell())# f.write('我擦嘞')
须知二:
文件对应的是硬盘空间,硬盘不能修改应为文件本质也不能修改,
我们看到文件的内容可以修改,是如何实现的呢?大的的思路:将硬盘中文件内容读入内存,然后在内存中修改完毕后再覆盖回硬盘具体的实现方式分为两种:1. 将文件内容发一次性全部读入内存,然后在内存中修改完毕后再覆盖写回原文件优点: 在文件修改过程中同一份数据只有一份缺点: 会过多地占用内存# with open('db.txt',mode='rt',encoding='utf-8') as f:# data=f.read()# with open('db.txt',mode='wt',encoding='utf-8') as f:# f.write(data.replace('kevin','SB'))
2. 以读的方式打开原文件,以写的方式打开一个临时文件,一行行读取原文件内容,修改完后写入临时文件...,删掉原文件,将临时文件重命名原文件名
优点: 不会占用过多的内存缺点: 在文件修改过程中同一份数据存了两份import oswith open('db.txt',mode='rt',encoding='utf-8') as read_f,\open('.db.txt.swap',mode='wt',encoding='utf-8') as wrife_f:for line in read_f:wrife_f.write(line.replace('SB','kevin'))os.remove('db.txt')os.rename('.db.txt.swap','db.txt')
大前提:文件内指针的移动是Bytes为单位的,唯独 t 模式下的read读取内容个数是以字符为单位。
# f.read(3)# with open('a.txt',mode='rt',encoding='utf-8') as f:# data=f.read(3)# print(data)# with open('a.txt',mode='rb') as f:# data=f.read(3)# print(data.decode('utf-8'))
f.seek(指针移动的字节数,模式控制): 控制文件指针的移动
模式控制:0: 默认的模式,该模式代表指针移动的字节数是以文件开头为参照的1: 该模式代表指针移动的字节数是以当前所在的位置为参照的2: 该模式代表指针移动的字节数是以文件末尾的位置为参照的强调:其中0模式可以在t或者b模式使用,而1跟2模式只能在b模式下用
f.tell()查看文件指针当前距离文件开头的位置
0模式详解with open('a.txt',mode='rt',encoding='utf-8') as f: f.seek(4,0) print(f.tell()) print(f.read())
with open('a.txt',mode='rb') as f: f.seek(4,0) f.seek(2,0) print(f.tell()) print(f.read().decode('utf-8'))
# with open('a.txt',mode='rt',encoding='utf-8') as f:# f.seek(5,0)# print(f.read())
1、模式详解
# with open('a.txt',mode='rb') as f:# f.seek(3,1)# print(f.tell())# f.seek(4,1)# print(f.tell())# print(f.read().decode('utf-8'))
2、模式详解
# with open('a.txt',mode='rb') as f:# f.seek(-9,2)# data=f.read()# print(data.decode('utf-8'))# tail -f access.logwith open('access.log',mode='rb') as f:f.seek(0,2)while True:line=f.readline()if len(line) == 0:# 没有内容continueelse:print(line.decode('utf-8'),end='')