← 返回
未分类

zhihu blog generator

知乎风格技术博客生成器 - 自动化生成高质量技术文章
知乎风格技术博客生成器 - 自动生成高质量技术文章
xieyuantao7 xieyuantao7 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 401
下载
💾 0
安装
1
版本
#latest

概述

知乎技术博客生成器 - Agent 工作指南

> 这是 Agent 的内部执行指南。README.md 是用户面向的使用说明。

一、文件结构

skill/
├── SKILL.md                    ← Agent 工作指南(本文档)
├── README.md                    ← 用户使用说明
├── lib/
│   ├── config.js               # 配置(路径、样式、规则)
│   ├── logger.js               # 日志记录工具
│   ├── file_utils.js           # 文件操作工具
│   ├── search_utils.js         # 搜索工具封装
│   └── paper_parser.js         # 论文解析工具
└── scripts/
    ├── 01_topic_selector.js     # Step 1: 话题选择(热门/指定主题)
    ├── 02_info_collector.js     # Step 2: 信息收集(网页、论文、代码)
    ├── 03_blog_generator.js     # Step 3: 博客初稿生成
    ├── 04_refine_blog.js        # Step 4: 反思优化(语言、深度、长度)
    ├── 05_output_md.js          # Step 5: 输出最终MD文档
    └── run_all.js               # 一键执行完整流程

二、会话目录结构

D:\techinsight\reports\blog_{session_id}\
├── 01_topic/                  # Step 1 输出
│   ├── topic_info.json        # 话题信息(标题、关键词、热度)
│   └── user_selection.json    # 用户选择记录
├── 02_collected/              # Step 2 输出
│   ├── web_pages/             # 网页内容 (.md)
│   ├── papers/                # 论文PDF及解析结果
│   └── code_snippets/         # 代码片段
├── 03_draft/                  # Step 3 输出
│   ├── outline.json           # 文章大纲
│   ├── blog_draft.md          # 初稿
│   └── references.json        # 引用来源
├── 04_refined/                # Step 4 输出
│   ├── refinement_notes.json  # 优化记录
│   └── blog_refined.md        # 优化稿
└── 05_output/                 # Step 5 输出
    └── {标题}_{日期}.md       # 最终文章

三、五步执行流程

① 话题选择  →  ② 信息收集  →  ③ 初稿生成  →  ④ 反思优化  →  ⑤ 输出文档

Step 1: 话题选择

1.1 两种模式

| 模式 | 触发条件 | 执行方式 |

|------|----------|----------|

| 指定主题 | 用户提供具体主题 | 直接使用,进入 Step 2 |

| 热门话题 | 用户要求获取热门话题 | 获取热门技术话题列表,让用户选择 |

1.2 获取热门技术话题

信息源:

  • GitHub Trending
  • Hacker News 热门
  • 知乎热榜科技板块
  • ArXiv 热门论文
  • Twitter/X Tech 热门

输出格式:

{
  "topics": [
    {
      "id": 1,
      "title": "Claude 4 发布:自主编程能力突破",
      "source": "GitHub/HackerNews/知乎",
      "hot_score": 95,
      "keywords": ["Claude", "AI编程", "Agent"],
      "brief": "一句话简介"
    }
  ],
  "timestamp": "2026-04-08T10:00:00Z"
}

交互流程:

  1. 展示 5-8 个热门话题(标题 + 热度 + 简介)
  2. 等待用户选择(输入序号或主题)
  3. 记录选择到 01_topic/user_selection.json

Step 2: 信息收集

2.1 搜索渠道策略

| 渠道 | 用途 | 搜索语法 |

|------|------|----------|

| ArXiv | 学术论文 | "[主题]" site:arxiv.org |

| GitHub | 开源项目、代码实现 | "[主题]" site:github.com |

| Hacker News | 技术讨论、观点 | "[主题]" site:news.ycombinator.com |

| Stack Overflow | 实战问题 | "[主题]" site:stackoverflow.com |

| 知乎 | 中文分析、深度解读 | "[主题]" site:zhihu.com |

| 技术博客 | 最佳实践 | "[主题]" blog/tutorial |

| 官方文档 | 权威信息 | "[主题]" documentation |

2.2 信息收集深度

对于每个话题,至少收集:

  • 2-3 篇核心论文(如有)
  • 5-15 个优质技术博客/文章
  • 2-3 个 GitHub 相关项目
  • 1-2 个官方文档页面

2.3 论文处理

如果发现论文:

  1. 下载 PDF 到 02_collected/papers/
  2. 提取关键信息:
    • 标题、作者、发表时间
    • 核心贡献
    • 关键图表(保存原图)
    • 实验结果
  3. 保存解析结果到 02_collected/papers/{论文名}_parsed.json

2.4 内容保存规范

网页内容:

02_collected/web_pages/
├── 001_github_{项目名}.md
├── 002_zhihu_{文章标题}.md
├── 003_blog_{来源}_{标题}.md
└── ...

每篇文章保存格式:

---
title: "文章标题"
source: "来源URL"
author: "作者"
date: "发布日期"
type: "github/zhihu/blog/paper"
---

# 正文内容
...

## 关键引用
- 重要观点1
- 重要观点2

Step 3: 博客初稿生成

3.1 知乎技术博客风格特点

| 特点 | 说明 | 实现方式 |

|------|------|----------|

| 标题党但不过分 | 吸引人点击,但有实质内容 | 使用数字、对比、悬念,但基于真实技术 |

| 开篇抓人 | 前3段决定阅读率 | 用场景、问题、数据开场 |

| 结构清晰 | 小标题分层,便于阅读 | 2-3级标题,每段不超过5行 |

| 图文并茂 | 代码、图表、示意图 | 论文原图、架构图、流程图 |

| 观点鲜明 | 不只是搬运,有独立见解 | 分析优缺点,给出判断 |

| 结尾有力 | 总结 + 引发思考 | 技术趋势、个人看法 |

3.2 推荐文章结构

# {标题:新颖、有观点、吸引人}

> 导语:1-2段,用场景/问题/数据引入主题,100-200字

## 一、背景:为什么会出现这项技术?
- 痛点分析
- 现有方案的不足
- 技术发展的必然性

## 二、核心原理:它是如何工作的?
- 架构图/流程图
- 关键机制详解(2-3个核心点)
- 与其他方案的对比

## 三、深入细节:源码级解读
- 关键代码片段分析
- 设计模式应用
- 性能优化点

## 四、实战应用:如何落地?
- 使用场景
- 最佳实践
- 踩坑经验

## 五、思考与展望
- 技术优势与局限
- 未来发展方向
- 个人见解

---
**参考来源:**
- [1] 论文/文章链接
- [2] GitHub 项目
- ...

3.3 内容深度要求

| 章节 | 字数要求 | 内容要求 |

|------|----------|----------|

| 导语 | 100-200字 | 抓人眼球,交代背景 |

| 背景 | 300-500字 | 有数据支撑,讲清楚为什么 |

| 核心原理 | 800-1500字 | 架构图 + 2-3个技术点详解 |

| 深入细节 | 600-1000字 | 代码/算法层面分析 |

| 实战应用 | 400-800字 | 具体场景,有案例 |

| 思考展望 | 300-500字 | 有独立观点,引发讨论 |

| 总计 | 2500-4500字 | |

3.4 引用管理

引用格式:

正文内容[^1],引用来源[^2]。

[^1]: [论文标题](链接) - 作者,年份
[^2]: [文章标题](链接) - 来源

Step 4: 反思优化

4.1 检查清单(Checklist)

语言风格检查

| 检查项 | 问题示例 | 优化方向 |

|--------|----------|----------|

| 去AI味 | "值得注意的是"、"不可否认的是" | 换成"我发现"、"坦白说" |

| 口语化 | 过于书面 | 适当用"咱们"、"说实话" |

| 生动表达 | "性能很好" | "性能吊打上一代"(适度) |

| 技术黑话 | 堆砌术语 | 术语首次出现加解释 |

内容丰富度检查

| 检查项 | 问题示例 | 优化方向 |

|--------|----------|----------|

| 有数据 | "性能提升很大" | "性能提升 40%,延迟降低 50ms" |

| 有案例 | "很多公司使用" | "Netflix、Uber 都在用,规模..." |

| 有对比 | "比其他方案好" | "对比 X 方案,在 Y 场景下 Z 优势" |

| 有源码 | 只讲概念 | 贴关键代码,逐行解读 |

| 有图表 | 纯文字堆砌 | 加架构图、流程图、论文原图 |

观点深度检查

| 检查项 | 问题示例 | 优化方向 |

|--------|----------|----------|

| 有判断 | "各有优劣" | "我认为在 X 场景选 Y 更好,因为..." |

| 有洞察 | 表面描述 | 分析设计决策背后的权衡 |

| 有预测 | 只讲现在 | 预判技术发展趋势 |

| 有个人色彩 | 像官方文档 | 加入"我的理解是"、"个人经验" |

结构逻辑检查

| 检查项 | 标准 |

|--------|------|

| 标题吸引人 | 一看就想点 |

| 导语抓人 | 前3段不枯燥 |

| 层次分明 | 小标题清晰,逻辑递进 |

| 段落适中 | 每段不超过5行 |

| 过渡自然 | 段落间有衔接 |

4.2 优化迭代

第一轮:去AI味

  • 搜索替换常见AI词汇
  • 增加个人语气词
  • 调整句式,长短结合

第二轮:补深度

  • 检查是否有量化数据
  • 补充源码分析
  • 增加对比案例

第三轮:加观点

  • 每个技术点加个人评价
  • 结尾加独立见解
  • 适度引发争议/讨论

第四轮:调长度

  • 目标:1000-5000字
  • 太短则补充细节
  • 太长则精简重复

4.3 输出记录

保存优化记录到 04_refined/refinement_notes.json

{
  "original_length": 2300,
  "refined_length": 3800,
  "iterations": [
    {
      "round": 1,
      "focus": "去AI味",
      "changes": ["替换'值得注意的是'等词汇", ...]
    }
  ],
  "quality_score": {
    "depth": 8,
    "readability": 9,
    "originality": 7
  }
}

Step 5: 输出最终文档

5.1 文件命名规范

{年份}{月份}{日期}_{主题关键词}_{标题关键词}.md

示例:
20260408_AI_Claude4自主编程深度解析.md
20260408_K8s_从源码看K8s调度器演进.md

5.2 输出路径

D:\techinsight\reports\blog_{session_id}\05_output\
└── {最终文章}.md

5.3 最终文档格式

---
title: "文章标题"
date: "2026-04-08"
topic: "技术主题"
word_count: 3500
keywords: ["关键词1", "关键词2"]
sources:
  - type: "paper"
    title: "论文标题"
    url: "..."
  - type: "github"
    title: "项目名"
    url: "..."
images:
  - path: "images/fig1.png"
    source: "论文原图"
---

# 文章标题

> 作者:AI技术博主
> 日期:2026-04-08

正文内容...

---

**关于作者:**
专注AI/云计算/后端技术,喜欢用代码说话。

**推荐阅读:**
- [相关文章1]
- [相关文章2]

5.4 图片处理

如果使用论文原图:

  1. 保存到 05_output/images/
  2. 文件名:{论文缩写}_fig{编号}.png
  3. 文中引用:!图1:描述

四、执行命令参考

完整流程

node scripts/run_all.js --topic "Claude 4" --mode "specific"

分步执行

# Step 1: 话题选择
node scripts/01_topic_selector.js --mode "hot"

# Step 2: 信息收集(基于 Step 1 结果)
node scripts/02_info_collector.js --topic-id 1

# Step 3: 生成初稿
node scripts/03_blog_generator.js

# Step 4: 反思优化
node scripts/04_refine_blog.js

# Step 5: 输出文档
node scripts/05_output_md.js

五、质量评估标准

5.1 发布前检查

  • [ ] 标题吸引人,不是泛泛而谈
  • [ ] 导语抓人,前3段不枯燥
  • [ ] 字数在 1000-5000 之间
  • [ ] 有至少 2 个数据/统计支撑
  • [ ] 有至少 1 段源码分析
  • [ ] 有架构图或流程图
  • [ ] 有明确的个人观点
  • [ ] 没有"值得注意的是"等AI高频词
  • [ ] 引用来源已标注
  • [ ] 段落长度适中(不超过5行)

5.2 知乎风格评分

| 维度 | 权重 | 评分标准 |

|------|------|----------|

| 标题吸引力 | 15% | 一看就想点 |

| 开篇抓人 | 15% | 前3段决定阅读率 |

| 技术深度 | 25% | 有源码、有原理、有数据 |

| 观点鲜明 | 20% | 不只是搬运,有判断 |

| 可读性 | 15% | 结构清晰,图文并茂 |

| 结尾有力 | 10% | 引发思考或讨论 |


六、最佳实践

  1. 标题是第一生产力 - 花20%时间想标题
  2. 开篇定生死 - 前3段必须抓人
  3. 数据说话 - 用数字替代形容词
  4. 源码为王 - 贴代码比讲概念有力
  5. 观点即价值 - 技术文章的灵魂是个人见解
  6. 图文并茂 - 一张图胜过千言万语
  7. 适度口语化 - 像跟人聊天,不是写论文
  8. 每步留痕 - 便于追溯和复盘
  9. 迭代优化 - 好文章是改出来的
  10. 保持更新 - 技术文章需要跟进行业动态

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-03 08:47 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

dev-programming

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 677 📥 325,711
ai-agent

self-improving agent

pskoett
捕获经验教训、错误及修正内容,以实现持续改进。适用于以下场景:(1)命令或操作意外失败;(2)用户纠正Claude(如“不,那不对……”“实际上……”);(3)用户请求的功能不存在;(4)外部API或工具出现故障;(5)Claude发现自身
★ 4,085 📥 813,275
ai-agent

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,383 📥 320,812