Python读取文本文件的核心方法是使用内置的open()
函数结合文件操作模式(如'r'
表示读取),配合read()
、readline()
或readlines()
等方法实现高效内容提取,适用于处理日志、数据分析等场景。
-
基础读取方法
通过with open('file.txt', 'r') as f:
确保文件安全打开与关闭,f.read()
一次性读取全部内容为字符串,适合小文件;f.readlines()
返回行列表,便于逐行处理。 -
大文件优化策略
使用for line in f:
迭代逐行读取,避免内存溢出,尤其适合GB级日志文件。结合strip()
或split()
可清理数据格式,提升后续处理效率。 -
编码与异常处理
指定编码(如encoding='utf-8'
)解决乱码问题,通过try-except
捕获FileNotFoundError
等异常,增强代码健壮性。 -
进阶应用场景
结合pandas
库的read_csv()
可快速解析结构化文本;json.load()
处理JSON文件;正则表达式匹配复杂文本模式,扩展Python的文本处理能力。
掌握这些方法能灵活应对不同文本读取需求,从简单配置解析到海量数据清洗均可高效完成。