Python 读取大文件
https://www.jianshu.com/p/560ff3adfee3
Python 读取文件一般可以使用 read()
,readlines()
,但这两种方法在读取大文件时都会存储内存缺陷。
1. read() 接口的问题
f = open(filename, 'rb')
f.read()
我们来读取 1 个规模为 3Gb 大小的文件,如人的参考基因组序列(hg19.fa)。read()
方法执行的操作,是一次性全部读入内存,显然会造成:MemoryError,也即会发生内存溢出!
2. readlines() 接口的问题