Python横向合并多个Excel文件的核心方法是利用pandas
库的concat
函数,通过axis=1
参数实现按列拼接,适用于数据结构行相同但列不同的场景。 关键步骤包括:安装依赖库、读取文件、横向合并、保存结果,高效解决多表整合问题,避免手动操作的低效与错误。
-
安装与导入库
使用pip install pandas openpyxl
安装必要库,pandas
负责数据处理,openpyxl
支持Excel读写。导入代码:python复制
import pandas as pd
-
读取Excel文件
通过pd.read_excel()
逐个读取文件,确保文件路径正确。示例:python复制
df1 = pd.read_excel('file1.xlsx') df2 = pd.read_excel('file2.xlsx')
-
横向合并数据
使用pd.concat([df1, df2], axis=1)
按列合并,axis=1
指定横向操作。若行索引不一致,可添加ignore_index=True
重置索引。 -
处理合并后数据
检查重复列或缺失值,常用drop_duplicates()
去重、fillna()
填充空值。例如:python复制
merged_df = merged_df.fillna(0) # 缺失值填充为0
-
保存结果
用to_excel()
输出合并文件,避免覆盖原文件:python复制
merged_df.to_excel('merged_output.xlsx', index=False)
提示:合并前需确保文件行数一致,否则会导致数据错位。对于复杂需求(如按关键字合并),可结合pd.merge()
实现更灵活的关联操作。