至尊技术网

统计

登录

标签搜索

首页
/
其他
/
正文

文章目录

使用正则表达式提取和格式化内容

其他

字符串过滤正则表达式的方法

悠悠楠杉

2025-06-28

/

0 评论

/

137 阅读

/

正在检测是否收录...

06/28

这里是文章的主体内容，长度大约1000字。
```

使用正则表达式提取和格式化内容

1. 提取标题（`#` 后的内容）

正则表达式：# (.*)
Python 示例代码：
python import re text = """# 文章标题这里是文章的主体内容...""" title_match = re.search(r'# (.*)', text) if title_match: title = title_match.group(1) print(f"Title: {title}")

2. 提取关键词（`## 关键词` 后的内容）

正则表达式：## 关键词(.*)
Python 示例代码：
python keywords_match = re.search(r'## 关键词(.*)', text) if keywords_match: keywords = keywords_match.group(1) print(f"Keywords: {keywords}") # 输出或处理关键词列表
注意：这里没有直接以列表形式提取，因为直接从字符串中提取并转换为列表需要进一步处理（如使用re.findall结合-符号）。为了简化示例，我们仅提取字符串。

3. 提取描述（紧跟`## 描述` 后的内容，直到`## 正文`）

正则表达式：## 描述(.*?)## 正文 （使用非贪婪匹配）
Python 示例代码：
python description_match = re.search(r'## 描述(.*?)## 正文', text) if description_match: description = description_match.group(1) print(f"Description: {description}") # 输出或处理描述内容
注意：这里使用非贪婪匹配.*?来确保只捕获到“## 描述”和“## 正文”之间的内容。

4. 提取正文（从“## 正文”开始到字符串末尾）

正则表达式：## 正文(.*) （全篇匹配）
Python 示例代码：（与之前类似，但这次是全篇匹配）
python body_match = re.search(r'## 正文(.*)', text) # 注意这将是全篇正文内容匹配结果，包括其后的任何内容，需注意处理边界问题。 if body_match: body = body_match.group(1) + "\n" # 加"\n"以保持Markdown格式的正确性（如需进一步处理可移除） print(f"Body:\n{body}") # 输出或处理正文内容，确保适当地断行和格式化。

朗读

赞（0）

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/31076/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权

评论 (0)

悠悠楠杉

37,548 文章数

92 评论量

人生倒计时

今日已经过去小时

这周已经过去天

本月已经过去天

今年已经过去个月