其他

一看就懂的正则表达式教程

悠悠楠杉

2025-06-05

0 评论

142 阅读

正在检测是否收录...

06/05

一看就懂的正则表达式教程

标题

正则表达式（Regular Expression，简称 regex）是一种强大的文本处理工具，它允许你定义一个模式来匹配字符串中的特定部分。无论是进行数据验证、查找替换、分析日志文件还是实现复杂的字符串操作，正则表达式都能派上用场。本教程将通过简单易懂的例子，帮助你快速掌握正则表达式的使用方法。

关键概念

在深入正则表达式的具体用法之前，先来了解一下几个关键概念：

模式（Pattern）：由特定的字符序列组成的规则，用于定义你要匹配的文本。
匹配（Match）：检查字符串是否符合特定的模式。
元字符（Metacharacters）：在正则表达式中有特殊含义的字符，如.、*、+、?、|等。
字符集（Character Classes）：如[abc]表示匹配任何单个字符a、b或c。
量词（Quantifiers）：用于指定模式的出现次数，如*表示零次或多次，+表示一次或多次，?表示零次或一次。
分组（Grouping）：通过圆括号()将多个元素组合成一个单元，可用于捕获匹配的文本或应用量词。
锚点（Anchors）：如^表示字符串的开始，$表示字符串的结束，用于确保模式从特定位置开始或结束。

基础示例

1. 匹配单个字符

表达式：a
描述：仅匹配字母"a"。
示例：匹配文本“apple”中的"a"。

2. 匹配任意字符（除了换行符）

表达式：.
描述：匹配除换行符以外的任意单个字符。
示例：在“hello, world!”中匹配除“o”以外的任意字符，即“ello, wrl!”中的“ello, w”。

3. 重复匹配前一个字符或模式多次

表达式：a* 或 a+ 或 a?
描述：分别表示“a”可以出现0次或多次、“a”至少出现一次、“a”可以出现0次或1次。
示例：在“aaaa”中分别匹配“0个a”、“至少1个a”、“0或1个a”。

4. 使用选择（|）实现多选一匹配

表达式：cat|dog
描述：匹配“cat”或“dog”。
示例：在“I have a cat.”和“I have a dog.”中分别找到匹配项。

5. 分组和引用（使用圆括号）

表达式：(abc)d+e+f?
描述：匹配包含“abc”开头，后面跟着一个或多个“d”，两个或多个“e”，零个或一个“f”的字符串。分组内的内容可以在后续被引用。
示例：在“abcdddef”中匹配并捕获“abc”。

6. 使用锚点进行精确匹配

表达式：^hello$ 或 \bword\b（其中\b是单词边界的锚点）
描述：分别表示整行完全为“hello”和单词“word”的边界。
示例：在“hello world”中只找到单独的“hello”，在“world hello”中只找到单词“hello”的边界匹配。

进阶技巧与实用场景

1. 非贪婪模式与懒惰量词（?）

默认情况下，正则表达式的量词（如*、+、?）是贪婪的，会尽可能多地匹配字符。通过在量词后添加?，可以改为懒惰模式，尽可能少地匹配字符。例如，在“aaa”中用a+?b可以匹配到单个"a"而非全部"aaa"。

2. 使用反向预查（?= 和 ?!）进行断言匹配

正向预查（Positive Lookahead）：如 (?=pattern)，确保后面能匹配pattern但不消耗任何字符。例如，在“cat hat”中查找以任何形式出现的“at”。
负向预查（Negative Lookahead）：如 (?!pattern)，确保后面不匹配pattern。例如，在“cat hat”中查找不跟在"h"后的"at"。

3. 综合应用实例——从HTML中提取邮箱地址

表达式：<[^>]+@([\w.-]+)\.\w+>
分析：这个表达式用于匹配HTML标签内的邮箱地址。它首先匹配一个完整的HTML标签 <...>，然后查找邮箱地址部分（包含字母、数字、点或横杠），最后是一个顶级域名。
通过以上例子和解释，你应该对正则表达式有了基本的理解和使用能力。正则表达式的真正威力在于其灵活性和可扩展性，随着你不断实践和探索更复杂的模式，你将能解决更多高级的文本处理问题。

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/28807/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权

一看就懂的正则表达式教程

一看就懂的正则表达式教程

标题

关键概念

基础示例

1. 匹配单个字符

2. 匹配任意字符（除了换行符）

3. 重复匹配前一个字符或模式多次

4. 使用选择（|）实现多选一匹配

5. 分组和引用（使用圆括号）

6. 使用锚点进行精确匹配

进阶技巧与实用场景

1. 非贪婪模式与懒惰量词（?）

2. 使用反向预查（?= 和 ?!）进行断言匹配

3. 综合应用实例——从HTML中提取邮箱地址

人生倒计时