Python读取xls文件的核心方法包括使用pandas
、xlrd
和openpyxl
三大库,其中pandas
凭借强大的数据处理能力成为首选,而xlrd
专注旧版xls格式,openpyxl
则兼容读写新版本文件。
-
pandas
库:通过read_excel()
函数一键加载数据为DataFrame,支持数据分析、缺失值处理和多表操作。安装需依赖xlrd
或openpyxl
引擎,适合复杂场景。例如:python复制
import pandas as pd df = pd.read_excel('file.xls') print(df.head())
-
xlrd
库:轻量级读取旧版xls文件,逐行提取数据简单高效,但仅支持读取且不兼容xlsx。示例:python复制
import xlrd workbook = xlrd.open_workbook('file.xls') sheet = workbook.sheet_by_index(0) for row in range(sheet.nrows): print(sheet.row_values(row))
-
openpyxl
库:主打xlsx读写,但对部分xls文件兼容,适合需修改文件的场景。需注意其处理xls时可能需格式转换:python复制
from openpyxl import load_workbook workbook = load_workbook('file.xls', read_only=True) sheet = workbook.active for row in sheet.iter_rows(values_only=True): print(row)
总结:根据需求选择工具——快速分析用pandas
,简单读取选xlrd
,编辑文件则用openpyxl
。注意文件格式兼容性,并确保安装对应依赖库。