其他

正则表达式详析与常用示例

悠悠楠杉

2025-06-21

0 评论

104 阅读

正在检测是否收录...

06/21

1. 简单示例：匹配邮箱地址

regex \b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z]{2,}\b
这个表达式用于匹配常见的邮箱地址格式，包括用户名、@符号、域名和顶级域名。其中，\b 表示单词边界，确保不会匹配到其他单词中的部分字符。

2. 数据验证：匹配身份证号

regex ^[1-9]\d{5}(19|20)\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|30|31)\d{3}[\dXx]$
该表达式用于验证中国大陆的18位身份证号码，包括地区码、出生日期和顺序码等部分。使用^和$确保整个字符串完全匹配，[1-9]确保第一位不是0（避免地区码为0开头的非中国大陆号码），(19|20)\d{2}表示出生年份的世纪和后两位，等等。

3. 文本处理：提取URLs

regex https?:\/\/(?:www\.)?[a-zA-Z0-9\-]+(\.[a-zA-Z]{2,})+([^\s]*)(?:\/[^\s]*)?(.*)?$
此表达式用于从文本中提取符合HTTP和HTTPS协议的URLs，包括可能的子域名、主域名及路径部分。通过非贪婪匹配[^s]*确保在空格前停止，有效处理连续的URLs或链接文本中包含的URLs。

4. 分组与引用：提取电话号码与国家代码

regex \+?(\d{1,3})?[-.\s]?(\d{10})\s*[\-\x20]*(\w+)
此表达式用于提取包含国家代码的电话号码及其国家名称。通过分组(\d{1,3})?可选地匹配国家代码，随后是区号和电话号码主体。最后一个分组捕获国家名称。注意使用非贪婪匹配和空格处理以适应不同格式的电话号码描述。

总结

正则表达式是一种功能强大且灵活的文本处理工具，能够以简洁的方式解决复杂的字符串匹配问题。掌握其基本语法和常用构造是进行有效文本分析、数据清洗和验证的关键。通过上述示例，我们可以看到正则表达式在电子邮件验证、身份证号校验、URL提取及电话号码处理等方面的广泛应用。实践是学习正则表达式的最佳方式，鼓励读者在各自的编程或文本处理工作中积极应用和探索更多高级特性。

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/30443/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权