在Python中打开CSV文件主要有三种方法:使用内置的csv
模块处理基础读写、通过pandas
库实现高级数据分析,或借助numpy
库进行数值计算。 其中,csv
模块适合简单操作,pandas
能高效处理复杂数据,而numpy
专注于数值矩阵处理。
-
内置csv模块
导入模块后,用open()
函数打开文件,结合csv.reader
逐行读取数据。例如:python复制
import csv with open('data.csv', 'r') as file: for row in csv.reader(file): print(row)
写入时使用
csv.writer
,支持自定义分隔符和字典读写(DictReader
/DictWriter
)。 -
pandas库
安装后通过pd.read_csv()
一键读取为DataFrame,支持自动处理缺失值、分块读取大文件及从URL加载数据:python复制
import pandas as pd df = pd.read_csv('data.csv') print(df.head())
导出数据用
df.to_csv()
,可忽略索引或指定编码格式。 -
numpy库
适用于数值密集型任务,np.genfromtxt()
可跳过表头并指定分隔符:python复制
import numpy as np data = np.genfromtxt('data.csv', delimiter=',', skip_header=1)
根据需求选择工具:轻量级操作选csv
,数据分析用pandas
,科学计算依赖numpy
。注意文件路径、编码(如UTF-8)和异常处理以确保稳定性。