Python加载Excel数据主要通过pandas
、openpyxl
等库实现,支持高效读取、灵活筛选和批量处理,是数据分析与自动化的核心技能之一。
-
基础方法:pandas库
安装pandas
后,使用pd.read_excel()
可直接读取Excel文件为DataFrame,支持指定工作表、列范围或跳过行。例如:python复制
import pandas as pd df = pd.read_excel('data.xlsx', sheet_name='Sheet1', usecols=['A:C'])
适用于快速导入结构化数据并进行统计分析。
-
精细操作:openpyxl库
适合需要单元格级控制的场景,如修改样式或遍历数据。示例:python复制
from openpyxl import load_workbook wb = load_workbook('data.xlsx') sheet = wb.active for row in sheet.iter_rows(values_only=True): print(row)
-
兼容旧版文件:xlrd库
针对.xls
格式,xlrd
提供稳定支持,但需注意版本兼容性(推荐1.2.0)。 -
性能优化技巧
- 批量写入数据减少I/O操作
- 关闭自动刷新以提升大文件处理速度
- 使用
usecols
或nrows
参数限制读取范围
掌握这些方法后,可轻松应对从简单报表到复杂数据清洗的需求,显著提升工作效率。