6.9 相关模块

表6.10列出了Python标准库里面与字符串有关的主要模块。

6.9 相关模块 - 图1

6.9 相关模块 - 图2核心模块:re

正则表达式(RE)提供了高级的字符串模式匹配方案。通过描述这些模式的语法,你可以像使用“过滤器”一样高效地查找传进来的文本。这些过滤器允许你基于自定义的模式字符串抽取匹配模式、执行查找-替换或分割字符串。

Python 1.5中加入的re模块代替了早期的regex和regsub模块,全面采用了Perl正则表达式语法,使得Python在对正则表达式的支持方面前进了一大步。Python 1.6里面重写了正则表达式引擎(SRE),增加了对Unicode字符串的支持并对性能进行了重大的升级。SRE引擎取代了原有正则表达式的模块下的PCRE引擎。

该模块中包含的关键函数有:compile()-将一个RE表达式编译成一个可重用的RE对象; match()-试图从字符串的开始匹配一个模式;search()-找出字符串中所有匹配的项; sub()-进行查找替换操作。其中的一些函数返回匹配到的对象,你可以通过组匹配来访问(如果找到的话)。15章整章的内容都是讲述正则表达式的。