追踪 GitHub 技术趋势、挖掘 AI 顶级项目、搜索 Awesome 精选资源、生成深度研究报告。
| 能力 | 说明 | 工具 |
|---|---|---|
| ------ | ------ | ------ |
| Trending | GitHub 真实 Trending Top 10(直接抓取 github.com/trending 页面) | fetch_real_trending.py |
| OSS Insight | OSS Insight 综合评分 Top 10(stars/forks/PRs/pushes 多维指标) | fetch_github_trending.py |
| AI Top | AI 领域活跃高星项目 Top 20(含活跃度过滤) | fetch_top_starred.py |
| Awesome | 按主题搜索 Awesome 列表并解析项目条目 | fetch_awesome_list.py |
| HF Papers | Hugging Face 每日热门论文 Top N(点赞排序) | fetch_hf_papers.py |
| DeepWiki | 对指定仓库生成深度研究报告 | fetch_deepwiki.py + 百度补充搜索 |
skills/tech-explorer/scripts/
├── fetch_real_trending.py # 真实 GitHub Trending(直接抓取 trending 页面解析)
├── fetch_github_trending.py # OSS Insight API 综合评分(GitHub Search API fallback)
├── fetch_top_starred.py # 按 topic 查活跃高星项目(含僵尸项目过滤)
├── fetch_awesome_list.py # 搜索并解析 Awesome 列表(sindresorhus 快速路径)
├── fetch_deepwiki.py # DeepWiki 深度研究(含 JS 渲染检测)
├── fetch_hf_papers.py # Hugging Face 热门论文(hf-mirror.com 镜像 API)
├── generate_excel_report.py # 生成美化 Excel 报告(4 个 Sheet,openpyxl,手机端可读)
├── generate_hf_papers_excel.py # 单独生成 HF Papers Excel(独立使用时)
└── post_translate_excel.py # 说明栏英文翻译后处理(extract → AI翻译 → apply)
触发词: "趋势追踪"、"技术趋势"、"本月热门"、"trending"、"生成趋势报告"
```bash
python3 skills/tech-explorer/scripts/fetch_real_trending.py monthly 10
```
支持参数:
daily / weekly / monthly(默认 monthly) > 脚本直接抓取 github.com/trending?since=monthly 页面 HTML,解析真实 Trending 项目(含 stars、forks、月增 stars)。
```bash
python3 skills/tech-explorer/scripts/fetch_github_trending.py "" monthly 10
```
支持参数:
python3 ... python monthly 10daily / weekly / monthly(默认 monthly)> 脚本走 OSS Insight API(TiDB),按 total_score 综合评分排序(含 stars/forks/PRs/pushes 多维指标)。
> OSS Insight 不可用时自动 fallback 到 GitHub Search API。
```bash
python3 skills/tech-explorer/scripts/fetch_top_starred.py ai 20
```
支持参数:
ai(默认)、machine-learning、deep-learning、llm 等任意 GitHub topic先将步骤 1、2、3 的 JSON 输出分别保存为临时文件,然后调用:
```bash
python3 skills/tech-explorer/scripts/generate_excel_report.py /tmp/real_trending.json /tmp/oss_insight.json /tmp/ai_top.json "clawDocument/草稿/tech-trends-{YYYY-MM}.xlsx"
```
或直接用 openpyxl 内联生成(参考 generate_excel_report.py 中的样式定义)。
```bash
python3 skills/tech-explorer/scripts/fetch_hf_papers.py 10 upvotes > /tmp/hf_papers.json
```
支持参数:
upvotes(默认)或 date > 脚本走 hf-mirror.com 镜像 API(国内可访问),获取每日热门论文(含点赞数、arXiv ID、GitHub 仓库、AI 摘要)。
先将步骤 1-5 的 JSON 输出分别保存为临时文件,然后调用:
```bash
python3 skills/tech-explorer/scripts/generate_excel_report.py /tmp/real_trending.json /tmp/oss_insight.json /tmp/ai_top.json "clawDocument/草稿/tech-trends-{YYYY-MM}.xlsx" /tmp/hf_papers.json
```
第5个参数(hf_papers.json)可选,不传则只生成3个 Sheet。
```bash
# Step 1: 提取所有英文说明单元格
python3 skills/tech-explorer/scripts/post_translate_excel.py extract "clawDocument/草稿/tech-trends-{YYYY-MM}.xlsx"
```
脚本输出 JSON,包含所有英文说明单元格的 sheet/row/col/text。
AI 逐条翻译后,将翻译结果写入 JSON 文件:
```json
{
"translations": [
{"sheet": "Trending Top 10", "row": 4, "col": 6, "text": "翻译后的中文"},
...
]
}
```
```bash
# Step 2: 写回翻译结果
python3 skills/tech-explorer/scripts/post_translate_excel.py apply "clawDocument/草稿/tech-trends-{YYYY-MM}.xlsx" /tmp/translations.json
```
Document Directory.xlsxTrending Top 10(真实 GitHub Trending)、OSS Insight (综合评分)、AI Top 20 和 HF Papers Top 10(Hugging Face 热门论文)tech-trends-{YYYY-MM}.xlsx参考实现见 memory/2026-04-08.md 中的 Python 代码(openpyxl 美化示例)
触发词: "awesome [主题]"、"搜索 awesome pdf"、"找 [领域] 最好的项目"、"精选列表"、"推荐 [领域] 开源项目"
```bash
python3 skills/tech-explorer/scripts/fetch_awesome_list.py [主题] 20
```
脚本自动执行:
awesome-{keyword} 仓库(按 stars 排序)```
📋 Awesome [主题] 精选资源
来源仓库: awesome-[主题] ⭐ xxx
🔗 https://github.com/xxx/awesome-[主题]
--- 精选项目 ---
🔗 https://...
```
如果脚本返回空结果(GitHub API 限流或网络问题),使用百度搜索兜底:
bash scripts/baidu-search.sh "awesome [主题] GitHub curated list" "" 10
触发时机: 用户从趋势报告或 Awesome 中选择了某个项目,说"深入了解"、"详细研究"、"研究一下 xxx"
```bash
python3 skills/tech-explorer/scripts/fetch_deepwiki.py "owner/repo"
```
```bash
bash scripts/baidu-search.sh "[项目名] 技术架构 核心功能 使用场景" "" 5
bash scripts/baidu-search.sh "[项目名] 快速上手 安装教程" "" 5
```
clawDocument/草稿/Document Directory.xlsx > 📁 研究报告已保存到 clawDocument/草稿/,是否移到:
> - 待处理/ — 等待后续加工
> - 专题研究/ — 作为研究资料长期保存
# {项目名} - 技术研究报告
**项目地址**: {github_url}
**Stars**: {stars} | **Language**: {language} | **License**: {license}
**研究时间**: {YYYY-MM-DD HH:MM:SS}
**数据来源**: DeepWiki + 百度千帆 AI Search
---
## 项目简介
{综合描述}
## 核心功能
{主要特性列表}
## 技术架构
{技术栈和架构信息}
## 适用场景
{应用场景和典型用例}
## 快速上手
{安装方法和基本使用示例}
## 学习资源
{官方文档、教程、社区链接}
---
*报告路径: clawDocument/草稿/tech-research-{项目名}-{timestamp}.md*
触发词: "生成本月趋势报告"、"技术趋势追踪"
完整自动化链路:
fetch_real_trending.py → 真实 GitHub Trending Top 10fetch_github_trending.py → OSS Insight 综合评分 Top 10fetch_top_starred.py → AI Stars Top 20fetch_hf_papers.py → HF 热门论文 Top 10clawDocument/草稿/post_translate_excel.py extract → 提取英文说明post_translate_excel.py apply → 写回中文翻译Document Directory.xlsxclawDocument/草稿/tech-trends-{YYYY-MM}.xlsxtech-research-{项目名}-{YYYYMMDD-HHMMSS}.mdDocument Directory.xlsxfetch_real_trending.py 直接抓取 github.com/trending 页面 HTML 并解析,数据最真实fetch_github_trending.py 走 OSS Insight API(综合评分数据),fallback 到 GitHub Search APIfetch_top_starred.py 走 GitHub Search API,含活跃度过滤(6个月内有push、fork比例检查、排除archived)fetch_awesome_list.py 优先尝试 sindresorhus 等知名维护者的直接路径,再走 GitHub Search API + README 解析fetch_deepwiki.py 直连 deepwiki.com,含 JS 渲染检测(needs_browser 标记),内容为空时提示用 web_fetch/browser 重试clawDocument/个人资料/baidu-api.conf共 1 个版本