Python中的split()
函数是用于将字符串按指定分隔符拆分成列表的核心方法,默认以空格分割且支持限制分割次数,广泛应用于文本解析、数据清洗等场景。
-
基础功能与语法
split()
通过sep
参数指定分隔符(默认为空格),maxsplit
控制最大分割次数。例如,"a,b,c".split(",")
返回['a', 'b', 'c']
,而"a b c".split(maxsplit=1)
得到['a', 'b c']
。 -
高频使用场景
- 处理结构化数据:如拆分CSV行(
"1,2,3".split(",")
)或日志("ERROR|2025".split("|")
)。 - 提取关键信息:限制分割次数可快速获取首段内容,如
"标题:内容".split(":", 1)
提取标题。
- 处理结构化数据:如拆分CSV行(
-
避坑与进阶技巧
- 空字符串处理:连续分隔符(如
",a,".split(",")
)会产生空元素,需用列表推导式过滤。 - 多分隔符场景:结合
re.split()
处理复杂分隔符(如re.split(r'[,;]', "a;b,c")
)。
- 空字符串处理:连续分隔符(如
-
性能优化与扩展
默认split()
自动合并连续空白符,而splitlines()
专用于按行分割。处理大文本时,生成器表达式可减少内存占用。
掌握split()
的灵活应用能显著提升字符串处理效率,建议结合实际需求选择参数组合,并注意边界条件测试。