Perl正则和Python正则的那些不一样

发布时间：2025-12-14 16:02:50 阅读：264 次

ref="/tag/2/" style="color:#874873;font-weight:bold;">Perl正则和Python正则的那些不一样

写脚本处理日志时，经常要用到正则表达式。比如从一堆访问记录里提取IP地址，或者把某个格式的日志转成结构化数据。这时候很多人会想到Perl和Python，但它们在正则上的用法其实有不少差异。

Perl是正则的老江湖了，从诞生起就深度集成正则功能，语法简洁直接。而Python虽然不是为正则而生，但re模块也足够强大，只是风格更“显式”一些。

在Perl里，匹配操作符m//、替换s///几乎是语言的一部分。比如：

$text = "Hello, 123 world";
if ($text =~ /\d+/) {
    print "找到数字
";
}

这里的 =~ 是绑定操作符，/\d+/ 直接就能用，不用引号包裹模式。看着顺眼，写起来也快。

Python就不一样了，得先import re，然后调用函数：

import re

text = "Hello, 123 world"
if re.search(r'\d+', text):
    print("找到数字")

模式得作为字符串传进去，虽然可以用r前缀避免转义麻烦，但总归多一层函数调用的感觉。

Perl的正则默认是区分大小写的，但加个i修饰符就忽略大小写：

$text =~ /hello/i

Python对应的是传flag：

re.search(r'hello', text, re.IGNORECASE)

另外，Python的match()只从字符串开头匹配，类似Perl的^锚点效果；要全局搜就得用search()或findall()，这点初学者容易踩坑。

两者都用括号做分组，提取内容也靠组索引。比如抓邮箱用户名：

import re
email = "user@example.com"
match = re.match(r'(\w+)@', email)
if match:
    print(match.group(1))  # 输出 user

Perl写法更紧凑：

if ($email =~ /(\w+)@/) {
    print "$1\n";  # $1代表第一个捕获组
}

Perl把捕获组直接放进$1、$2变量里，随取随用，代码看起来干净。Python则要通过match对象的group()方法拿，稍微啰嗦点。

这是最根本的区别。Perl把正则当语言特性，像+、-一样自然。Python把它当作文本处理工具之一，放在re模块里规规矩矩地用。

所以你在Perl里可以一行搞定的事，在Python里可能得多写两行。比如批量替换：

# Perl一行命令就能处理文件
perl -pe 's/\berror\b/warning/gi' logfile.txt

Python做不到这么紧凑，要么写脚本，要么用命令行-l选项配合eval，但可读性差很多。

如果你是在运维环境快速处理一批文本，Perl的一行式特别趁手。很多老系统日志分析脚本至今还是.pl结尾。

但如果是写新项目，尤其是需要和其他模块协作、做API服务或数据分析，那Python明显更合适。re模块虽然没那么“酷”，但配合pandas、requests这些库，干活效率高得多。

而且现在Python还有regex这种第三方库，支持更复杂的模式，比如可变长度的lookbehind，补齐了一些短板。

说到底，Perl正则像是随身小刀，轻巧锋利；Python则是工具箱里的多功能钳，功能全，组合性强。用哪个，看你要修水管还是搭架子。