Python读取表格中的一列内容可以通过pandas
库的read_excel()
或read_csv()
方法加载数据,再使用df['列名']
或df.iloc[:, 列索引]
提取指定列。 这种方法简单高效,适用于Excel、CSV等多种表格格式,还能结合条件筛选或数据处理操作。
-
使用
pandas
读取表格文件
安装pandas
库后,通过read_excel()
或read_csv()
加载表格数据为DataFrame对象。例如:pythonCopy Code
import pandas as pd df = pd.read_excel('data.xlsx') # 读取Excel文件
或
pythonCopy Code
df = pd.read_csv('data.csv') # 读取CSV文件
-
按列名提取数据
若表格包含列名(如“姓名”“年龄”),直接用df['列名']
获取该列数据:pythonCopy Code
column_data = df['姓名'] # 提取“姓名”列
返回结果为Series类型,可通过
.tolist()
转为列表。 -
按列索引提取数据
无列名或需按位置提取时,用iloc[:, 列索引]
(索引从0开始):pythonCopy Code
column_data = df.iloc[:, 1] # 提取第2列
注意:若第一行为表头,需添加参数
header=0
。 -
进阶操作:条件筛选与清洗
提取列后可进一步处理,例如筛选特定值或去空值:pythonCopy Code
filtered_data = df[df['年龄'] > 18]['姓名'] # 筛选年龄大于18的姓名 cleaned_data = df['分数'].dropna() # 去除空值
-
其他库的替代方案
-
openpyxl
(适用于Excel):逐行读取单元格,适合小规模数据。 -
csv
模块(适用于CSV):用reader
对象遍历行后取对应索引。
-
掌握pandas
的核心方法能快速完成表格列提取,结合数据清洗或分析需求灵活扩展。若仅需简单读取,也可选择轻量级库减少依赖。