Python中的split()
函数是处理字符串分割的核心工具,它能将字符串按指定分隔符拆分为列表,默认以空格分割且自动处理连续空白符。 通过灵活设置分隔符和分割次数,可高效解析CSV、日志等结构化文本,同时需注意空字符串和特殊字符的处理技巧。
-
基础分割:默认按空格分割,自动合并连续空白符。例如
"Hello Python".split()
返回['Hello', 'Python']
,首尾空格会被忽略,适合处理自然语言文本。 -
指定分隔符:通过参数
sep
自定义分隔符,如处理CSV时用"A,B,C".split(",")
得到['A', 'B', 'C']
。需警惕连续分隔符产生的空字符串(如"苹果,,橘子".split(",")
输出['苹果', '', '橘子']
),可用列表推导式过滤。 -
控制分割次数:参数
maxsplit
限制分割次数。例如解析日志"ERROR|代码行:123|时间:2025"
时,split('|', 1)
仅分割首次出现的|
,保留后续信息完整,输出['ERROR', '代码行:123|时间:2025']
。 -
进阶处理:多行文本推荐用
splitlines()
兼容不同换行符;复杂分隔符(如混合符号)可结合re.split()
实现正则匹配分割,例如re.split(r'[;=|]', "价格:¥199;折扣=50%")
精准拆分为价格与折扣字段。
提示:实际应用中,建议先清洗数据(如strip()
去首尾空格)再分割,并测试边界条件。对于超长文本或高频操作,考虑生成器或预编译正则提升性能。