悠悠楠杉
网站页面
正则表达式(Regular Expressions,简称 regex)是一种强大的文本处理工具,被广泛应用于字符串的搜索、替换、验证等操作中。以下是一个正则表达式速查表,包含了常见的模式、用途及示例,旨在帮助你快速掌握其使用方法。
\d
:匹配任何数字(0-9)。\D
:匹配任何非数字字符。\w
:匹配任何字母数字字符(等同于 [a-zA-Z0-9_]
)。\W
:匹配任何非字母数字字符(等效于 [^a-zA-Z0-9_]
)。.
:匹配除换行符外的任何单个字符。*
:匹配前面的子表达式零次或多次。+
:匹配前面的子表达式一次或多次。?
:匹配前面的子表达式零次或一次。|
:逻辑“或”操作符,匹配任一条件。()
:标记一个子表达式的开始和结束,可进行分组和捕获。^
:匹配输入字符串的开始位置,如果设置 multiline
模式,还表示一行的开始。$
:匹配输入字符串的结束位置,如果设置 multiline
模式,还表示一行的结束。\b
:匹配一个单词边界,即字词与空格间的位置。.
、*
、+
等),需要在它前面加上反斜杠进行转义,如.
表示任意字符需写作\.
。\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b
用于匹配标准的电子邮件地址。https?://(?:www\.)?[A-Za-z0-9.-]+\.[A-Z]{2,}(?:/[A-Za-z0-9_./?=&+-]*)?
用于匹配以https或http开头,包含域名和可选路径的URL。\d{3}-\d{8}|\d{4}-\d{7}
用于匹配中国大陆的手机号格式,包括11位数字和三位分机号的情况。[\u4e00-\u9fa5]+
用于匹配一个或多个中文字符。(\d{1,3}\.){3}\d{1,3}
用于匹配IPv4地址的格式。\bword\b
用于查找独立的单词“word”,不匹配“wording”或“wordman”等单词的一部分。.{5,10}
用于匹配任意长度的字符串,但长度在5到10个字符之间。^[^ ]+
用于匹配非空行,即首字符不是空格的行。<[^>]+>
用于匹配HTML标签内的内容(不包括标签外的文本)。#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})
用于匹配十六进制颜色代码(如#FFFFFF或#FFF)。(?=pattern)
表示零宽断言(正向预查),检查某模式是否出现在目标位置但不消耗字符;(?!pattern)
表示负向预查,确保某模式未出现在目标位置。通过上述速查表,你可以快速参考和运用正则表达式来解决各种文本处理问题。熟练掌握正则表达式将大大提高你在数据处理、文本分析等方面的效率。