悠悠楠杉
网站页面
中文和全角字符的Unicode范围分别是:
- 中文:\u4e00-\u9fa5
(基本中文汉字)
- 全角标点及符号:\uFF01-\uFF60
(全角标点)、\uFF21-\uFF3A
(全角英文字母)、\uFF41-\uFF5A
(全角数字)
#)、段落(p
)、关键词(可以是加粗的**关键词**
)、描述等。我们可以使用正则表达式随机生成这些元素,并保证中文字符和全角字符的混合使用。
```python
import random
import re
content(length=1000):
# 生成随机标题
title = ''.join(random.choices(string.ascii_letters + string.digits, k=random.randint(2, 6))) # 随机英文或数字标题
title += ' '.join(random.choices(' 中', k=random.randint(0, 2))) # 确保至少有一个中文字符或全角空格(' ')
# 生成关键词,并确保有中文字符或全角字符
keywords = ' '.join(random.choices(' '.join(re.findall(r'[\u4e00-\u9fa5\uFF01-\uFF60]', text)), k=3)) # 随机选取含中文或全角的关键词
keywords = f'**{keywords}**' # 加粗关键词
# 生成描述,确保中英文和全角字符混合使用
description = ''.join(random.choices(string.ascii_letters + string.digits + ' 中' + '。「', k=random.randint(5, 15))) # 随机字符集包括中英文和全角标点
description += ' ' + ''.join(random.choices('。「・', k=random)) # 添加全角标点作为描述结束
# 生成正文内容,控制长度在1000字左右
text = []
for _ in range(random.randint(15, 25)): # 生成15到25个段落(每段约40字)
paragraph = ''.join(random.choices(string.ascii_letters + string.digits + ' 中' + '。「・、', k=random.randint(20, 50))) # 随机生成段落内容,包括中英文和全角标点等
text.append(f'\n> {paragraph}') # 使用Markdown的引用标记来模拟不同段落
if len(''.join(text)) > length: # 检查总长度是否超标,如果超标则减少后续段落的长度
break
text = '\n'.join(text) # 将列表转为字符串形式
return f"""# {title}
{keywords}
{description}
{text}"""
content())
```