正则表达式

最新推荐文章于 2023-07-29 20:09:05 发布

原创最新推荐文章于 2023-07-29 20:09:05 发布 · 341 阅读

CC 4.0 BY-SA版权

文章标签：

正则表达式（Regular Expression）是一种文本模式，使用普通字符和特殊字符定义一个特殊的字符串来描述和匹配符合某个语法规则的字符串。正则表达式入门稍微难点，但是学会之后真的会提高效率，而且有满满的装逼感。

下表的字符用来描述字符串或者单词的边界

使用方括号来指定多个字符区间

下表里面的字符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配

字符	描述
.	匹配除换行符 \n 之外的任何单字符
*	匹配前面的子表达式零次或多次
+	匹配前面的子表达式一次或多次
?	匹配前面的子表达式一次或零次
{n}	n 是一个非负整数，匹配确定的n次
n,}	n 是一个非负整数，匹配至少n次
{n,m}	m和n均为非负整数，其中n<=m。最少匹配n次且最多匹配m次

下表列出转义字符，也是正则表达式中的组成部分

但用圆括号会有一个副作用，使相关的匹配会被缓存，此时可用非捕获元(?:, ?=, ?!)放在第一个选项前来消除这种副作用

字符	描述
汉字(字符)	[\u4e00-\u9fa5]
匹配由26个英文字母组成的字符串	¹+$
网址（URL）	[a-zA-z]+://[^\s]*
时间(小时:分钟, 24小时制)	$((1
日期格式(yyyy-mm-dd)	^\d{4}-\d{1,2}-\d{1,2}
至少8个字符，至少1个大写字母，1个小写字母和1个数字,不能包含特殊字符（非数字字母）	^(?=.[A-Za-z])(?=.\d)[A-Za-z\d]{8,}$

python中的库文件re中定义了正则表达式常用函数。

re.compile(pattern[, flags])函数用于编译正则表达式，生成一个正则表达式对象，供 match() 和 search() 这两个函数使用
re.match(pattern, string, flags=0)从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，则返回None
re.search(pattern, string, flags=0)扫描整个字符串并返回第一个成功的子串

re.match和re.search的区别在于：re.match从字符串的起始开始匹配，发现字符不符合正则表达式时，匹配失败，返回None；而re.search则匹配整个字符串，直到字符串的末尾