今天介绍正则表达式,其他的模块看py官方文档应该能看懂。

首先需要模块re。
.称为通配符,和除了换行符以外的字符匹配,例如”.ython”和”qython”,”+ython”都匹配。
我们可以用两个斜杠对特殊字符进行转义,例如”python\.org”。如果不喜欢两个斜杠可以使用原始字符串r”python.org”。
我们可以用方括号创建一个字符集,字符集只能匹配一个字符,例如”[pj]ython”可以匹配”python”和”jython”。”[a-z0-9A-z]ython”与大写字母,小写字谜,数字都匹配。排除指定字符集可以加^,如[^abc]。
(|)实现二选一,例如”p(ython|erl)”。
问号实现可选子模式,例如”(http://)?python\.org”匹配”python\.org”和”http://python\.org” 。
我们可以在可选的基础上重复子模式,* 表示0,1或多次,+表示1或多次,{m,n}表示m-n次。例如”w\.python\.org”可以匹配”\.python\.org””w\.python\.org””w\.python\.org””www\.python\.org””wwwwwww\.python\.org”。
我们也可以把匹配指定在开头或末尾,用脱字符^表示,例如”^ht+p”可以与”http://python\.org” 匹配但不与”www.http.org” 匹配。表示末尾用$。
关于re模块使用参见官方文档。
由于万恶的高数,明天接着写一些关于正则表达式的使用。