文章详情页

Python基于read(size)方法读取超大文件

浏览：8日期：2022-08-02 15:12:37

pyhon读取文件很方便,但是,如果文件很大,而且还是一行文件,那就蛋疼了. 不过还好有read(size)方法,这个方法就是每次读取size大小的数据到内存中

下面来个示例

def readlines(f, separator): ’’’ 读取大文件方法 :param f: 文件句柄 :param separator: 每一行的分隔符 :return: ’’’ buf = ’’ while True: while separator in buf: position = buf.index(separator) # 分隔符的位置 yield buf[:position] # 切片, 从开始位置到分隔符位置 buf = buf[position + len(separator):] # 再切片,将yield的数据切掉,保留剩下的数据 chunk = f.read(4096) # 一次读取4096的数据到buf中 if not chunk: # 如果没有读到数据 yield buf # 返回buf中的数据 break # 结束 buf += chunk # 如果read有数据 ,将read到的数据加入到buf中with open(’text.txt’,encoding=’utf-8’) as f: for line in readlines(f,’|||’): # 为什么readlines函数能够使用for循环遍历呢, 因为这个函数里面有yield关键字呀, 有它就是一个生成器函数 ...... print(line)

测试文件text.txt

fgshfsljflsjfls|||fyhdiyfdfhn|||fudofdb钦铁杆jdlfdl|||tedsthfdskfdk

打印结果

fgshfsljflsjflsfyhdiyfdfhnfudofdb钦铁杆jdlfdltedsthfdskfdk

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持好吧啦网。

Python 编程

上一条：Python线程协作threading.Condition实现过程解析下一条：Python函数生成器原理及使用详解

相关文章：

1. Kmeans均值聚类算法原理以及Python如何实现2. ajax、axios和fetch之间优缺点重点对比总结3. 基于python locust库实现性能测试4. JavaScript对象访问器Getter及Setter原理解析5. python给list排序的简单方法6. Python 测试框架unittest和pytest的优劣7. CSS自定义滚动条样式案例详解8. 仅用PHP4 Session实现的迷你购物篮(一)9. python中的插入排序的简单用法10. Java源码解析之LinkedHashMap

排行榜

					
					基于python locust库实现性能测试
Java源码解析之LinkedHashMap
CSS自定义滚动条样式案例详解
Python 测试框架unittest和pytest的优劣
仅用PHP4 Session实现的迷你购物篮(一)
Kmeans均值聚类算法原理以及Python如何实现
ajax、axios和fetch之间优缺点重点对比总结
idea修改背景颜色样式的方法
idea导入maven项目的方法
JavaScript对象访问器Getter及Setter原理解析
Java程序文件格式设计
				

热门标签