作用
快速高效的查找和分析字符串. 也可以用于验证一个字符串是否符合某个给定的规则.
示例
描述一个或多个空白符的regex是\s+:
In [81]: import re
In [82]: text="foo bar\t baz \tqux"
In [83]: re.split('\s+',text)
Out[83]: ['foo', 'bar', 'baz', 'qux']
可以用re.compile( )编译regex以得到一个可重用的regex对象
In [84]: regex=re.compile('\s+')
In [86]: regex.split(text)
Out[86]: ['foo', 'bar', 'baz', 'qux']
得到匹配regex的所有格式
In [87]: regex.findall(text)
Out[87]: [' ', '\t ', ' \t']
扫描整个字符串以匹配模式,如果找到则返回一个匹配项对象
In [105]: m=regex.search(text)
In [106]: m.span() //span()会显示匹配到的下标
Out[106]: (3, 6)
In [107]: text[m.start():m.end()]
In [108]:
将匹配到的模式替换成指定字符串
In [108]: text
Out[108]: 'foo bar\t baz \tqux'
In [109]: regex.sub(':',text)
Out[109]: 'foo:bar:baz:qux'
正则表达式方法
方法 | 说明 |
---|---|
findall、finditer | 返回字符串中所有的非重叠匹配模式 |
search | 扫描整个字符串以匹配模式 |
match | 只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None |
split | 根据找到的模式将字符串拆分成数段 |
sub | 将字符串中所有的(sub)或前n个(subn)模式替换成指定表达式 |