在Python中读取CSV文件主要有三种高效方法:内置csv
模块适合基础操作,pandas
库提供强大的数据分析功能,numpy
库则专注于数值计算。 其中,pandas.read_csv()
是最推荐的方式,支持自动分隔符识别、缺失值处理和复杂数据操作,适合大多数场景。
-
使用内置
csv
模块
通过csv.reader
逐行读取为列表,或csv.DictReader
转换为字典(键为表头)。优点是无需安装第三方库,但功能较基础。示例代码:python复制
import csv with open('data.csv', newline='') as file: for row in csv.reader(file): print(row)
-
使用
pandas
库
pd.read_csv()
一键读取为DataFrame,支持分块处理大文件、指定列名和数据类型。适合数据清洗与分析:python复制
import pandas as pd df = pd.read_csv('data.csv', na_values=['NA']) print(df.head())
-
使用
numpy
库
np.genfromtxt()
适合数值计算,可跳过表头并填充缺失值。示例:python复制
import numpy as np data = np.genfromtxt('data.csv', delimiter=',', skip_header=1)
根据需求选择工具:简单任务用csv
模块,数据分析用pandas
,数值计算用numpy
。注意文件编码(如UTF-8)和路径正确性以确保读取成功。