自动从网上搜集最新网络热梗,与 Dify 知识库去重后写入新梗。
运行前需要以下信息(优先从 TOOLS.md 或用户消息获取):
| 参数 | 说明 | 示例 |
|---|---|---|
| ------ | ------ | ------ |
DATASET_ID | Dify 知识库 ID | 57bd8e53-b1bd-4124-8219-fff573733a40 |
API_KEY | Dify API Key | dataset-xxx |
PROXY | HTTP 代理(访问 Dify API) | http://127.0.0.1:20171 |
如果用户未提供,询问。
运行脚本获取知识库中已有的梗名称列表:
python3 scripts/dify_ops.py --dataset-id $DATASET_ID --api-key $API_KEY --proxy $PROXY list
记住这个列表,后续搜集时跳过同名梗。
用 web_search 搜索最新热梗。搜索策略:
"2025年最新网络热梗 流行语""最近一周网络热梗 盘点""抖音 B站 最新流行梗""网络流行语 新梗 盘点""小红书 微博 热梗"web_fetch 抓取搜索结果中的盘点文章,提取梗的详细信息对每条搜集到的梗:
references/meme-format.md)将去重后的新梗构造为 JSON 数组,用脚本批量写入:
# JSON 格式:[{"name": "梗名称", "text": "Markdown内容"}, ...]
python3 scripts/dify_ops.py --dataset-id $DATASET_ID --api-key $API_KEY --proxy $PROXY batch --json-file /tmp/new_memes.json
脚本会自动再次检查去重(双重保险)。
向用户汇报:
search_lang: "zh" 和 country: "CN" 确保中文结果共 1 个版本