TypechoJoeTheme

至尊技术网

统计
登录
用户名
密码
/
注册
用户名
邮箱

正则表达式特别需要注意的点:“空“字符的匹配方法

2025-06-03
/
0 评论
/
8 阅读
/
正在检测是否收录...
06/03

1. 空格字符

  • 普通空格\s 可以匹配任何空白字符,包括空格、制表符等。
  • 不间断空格(通常在网页中使用的 ):需要用\u00A0进行匹配。
  • 宽空格:可以用\u3000来匹配。

2. 制表符(Tab)

3. 换行符

  • 在不同的操作系统中,换行符的表现形式不同:

    • Unix/Linux 使用 \n
    • Windows 使用 \r\n
    • Mac 旧版使用 \r
  • 通常在正则表达式中,为了兼容多种系统,可以同时考虑这三种情况:[\r\n]+ 来匹配换行。

4. 连续空白字符的处理

  • 如果你想匹配一个或多个空白字符(包括空格、制表符等),可以使用\s+。这有助于确保连续的空白被视为一个单位进行匹配或替换。
  • 如果你想确保匹配的字符串不包含任何连续的空白(即“压缩”空白),可以使用\s{1}(但通常使用\s+作为简化)。

regex (\b\w+\b) # 匹配单词边界的单词(标题或关键词) (\s+\b\w+\b) # 匹配至少一个空格后跟着的单词,确保不是连续空格的一部分
这个例子中,我们首先匹配一个完整的单词(假设它是标题或关键词),然后确保后续的单词不是由连续的空格分隔的。这有助于识别并提取没有使用多个连续空格来分割的元素。

总结

\s、\t\n[\r\n]+等元字符,你可以有效地处理和识别这些看似“空”但实际上有重要意义的字符。

朗读
赞(0)
版权属于:

至尊技术网

本文链接:

https://www.zzwws.cn/archives/28575/(转载时请注明本文出处及文章链接)

评论 (0)

人生倒计时

今日已经过去小时
这周已经过去
本月已经过去
今年已经过去个月

最新回复

  1. 强强强
    2025-04-07
  2. jesse
    2025-01-16
  3. sowxkkxwwk
    2024-11-20
  4. zpzscldkea
    2024-11-20
  5. bruvoaaiju
    2024-11-14

标签云