Python的split()
函数是处理字符串分割的核心工具,它能将字符串按指定分隔符拆分为列表,默认以空格分割且支持限制分割次数。 这一功能在数据清洗、日志解析等场景中极为高效,且无需额外安装库即可直接使用。
-
基础用法
不传参数时,split()
默认以空格、换行符\n
、制表符\t
等空白字符分割。例如,"a b c".split()
返回['a', 'b', 'c']
。若字符串含连续空格,会自动合并处理,避免空元素。 -
自定义分隔符
通过sep
参数指定任意字符串作为分隔符,如"a,b,c".split(",")
得到['a', 'b', 'c']
。分隔符支持多字符(如"a||b||c".split("||")
),但需注意中文或特殊符号需正确转义。 -
控制分割次数
maxsplit
参数可限制分割次数。例如,"a-b-c-d".split("-", 2)
返回['a', 'b', 'c-d']
,仅分割前两处。负数值表示无限制(默认行为)。 -
实际应用场景
- 文件路径处理:用
\\
分割路径提取文件名,如path.split("\\")[-1]
。 - 数据格式化:将CSV字符串
"1,2,3"
转为列表['1', '2', '3']
。 - 日志解析:结合正则表达式处理复杂分隔符(如
re.split('\s+', log)
)。
- 文件路径处理:用
-
注意事项
- 分隔符需为字符串类型,否则报错
TypeError
。 - 空字符串分割返回单元素列表(如
"".split()
得['']
)。 - 与
splitlines()
区分:后者专用于按行分割(\n
或\r\n
)。
- 分隔符需为字符串类型,否则报错
掌握split()
的灵活用法能大幅提升文本处理效率,建议结合具体需求选择参数组合,并注意边界条件测试以确保稳定性。