悠悠楠杉
网站页面
正则表达式主要由以下部分组成:
*
, +
, ?
, |
, ()[]{}
, .
等,它们在正则表达式中有特殊含义。|
表示“或”,()
用于分组,[]
用于指定字符集等。\
用于转义特殊字符,使其失去特殊含义,如\.
表示点号字符本身而非任意字符。.
:匹配除换行符以外的任意单个字符。*
:匹配前面的子表达式零次或多次。+
:匹配前面的子表达式一次或多次。?
:匹配前面的子表达式零次或一次。|
:A|B,匹配A或B。()
: 分组,如(ab)表示同时匹配a和b作为一个整体。[]
: 字符集,匹配方括号内的任何一个字符。如[abc]匹配a、b或c。{}
: 指定数量的匹配,如a{2}匹配两个连续的a。regex
\d # 匹配任意数字(0-9)
\w # 匹配任意字母数字或下划线(相当于[a-zA-Z0-9_])
\s # 匹配任意空白符(如空格、制表符等)
regex
(abc|def) # 匹配abc或def中的一个整体字符串
a(b|cd)e # 匹配abe或acde中的一个字符串
regex
a{2,4} # 匹配aa到aaaa中的任意一个(至少2次,最多4次)
a* # 匹配零个或多个a的连续出现(相当于a{0,})
a+ # 匹配一个或多个a的连续出现(相当于a{1,})
regex
[^abc] # 匹配除了abc之外的任意单个字符(等价于a|b|c的补集)
(?!pattern) # 负向预查,不匹配后面跟有特定模式的字符串(如[^a]b不匹配后跟'a'的'b')
\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b
。https?:\/\/.*?\b
。