← 返回
未分类

源码分析

GitHub源码与提示词分析工具。用于:1) 下载GitHub仓库/npm包源码 2) 从闭源二进制中提取系统提示词和工具定义 3) 分析AI Agent架构与提示词工程 4) 生成结构化研究报告。触发词:源码分析、提示词提取、system prompt、github源码、二进制分析、reverse engineer prompt、agent架构分析
GitHub源码与提示词分析工具。用于:1) 下载GitHub仓库/npm包源码 2) 从闭源二进制中提取系统提示词和工具定义 3) 分析AI Agent架构与提示词工程 4) 生成结构化研究报告。触发词:源码分析、提示词提取、system prompt、github源码、二进制分析、reverse engineer prompt、agent架构分析
user_2c4ce67f
未分类 community v1.0.0 1 版本 98630.1 Key: 无需
★ 0
Stars
📥 72
下载
💾 0
安装
1
版本
#latest

概述

Source Analysis

从GitHub仓库和npm包中提取、分析AI Agent的源码与系统提示词。

适用场景

  • 分析闭源AI工具(如Claude Code、Cursor、Copilot等)的提示词架构
  • 从npm/PyPI包中提取编译后的源码和配置
  • 研究竞品Agent的工具定义、权限系统、记忆机制
  • 生成对比分析报告

工作流程

Phase 1: 信息收集

  1. GitHub仓库探索

```bash

# 获取README

curl -s -L --max-time 15 "https://raw.githubusercontent.com/{owner}/{repo}/main/README.md"

# 获取仓库结构(如果API可达)

curl -s -L --max-time 15 "https://api.github.com/repos/{owner}/{repo}/git/trees/main?recursive=1"

# 检查关键文件

for path in "package.json" "src/index.ts" "CLAUDE.md" ".claude/CLAUDE.md" "plugins/README.md"; do

code=$(curl -s -o /dev/null -w "%{http_code}" --max-time 10 "https://raw.githubusercontent.com/{owner}/{repo}/main/$path")

echo "$path → HTTP $code"

done

```

  1. npm包下载

```bash

# 下载wrapper包

cd /tmp && npm pack @{scope}/{package-name}

tar xzf {package-name}-*.tgz

# 检查是否为壳子分发(常见模式)

ls -lh package/bin/

file package/bin/* # 如果是小文件(<1KB),只是占位符

# 下载平台特定二进制

npm pack @{scope}/{package-name}-linux-x64

tar xzf -linux-x64-.tgz

```

Phase 2: 二进制提取

当源码是编译后的原生二进制时:

# 检查二进制大小
ls -lh package/claude

# 提取身份声明
grep -aoP 'You are [^"]{0,500}' /path/to/binary | sort -u

# 提取系统提示词章节
grep -aoP '"# [A-Z][^"]{0,200}"' /path/to/binary | sort -u

# 提取工具定义
grep -aoP '"tool_name":"[^"]*"' /path/to/binary | sort -u

# 提取行为指令
grep -aoP '(Prefer|Avoid|Be |Do not|Never|Always|When |If |Use |Keep |Make sure)[^"]{0,300}' /path/to/binary | sort -u

# 提取配置参数
grep -aoP '--system-prompt[^"]{0,200}' /path/to/binary | head -10

# 提取特性标志
grep -aoP 'tengu_[a-z_]+' /path/to/binary | sort -u

Phase 3: 工具定义分析

从TypeScript定义文件(如sdk-tools.d.ts)中提取:

  • 工具名列表
  • 输入/输出Schema
  • 权限模型
  • 并发安全性标记

Phase 4: 报告生成

输出结构化报告,包含:

  1. 架构概览(分发方式、技术栈)
  2. 系统提示词(身份、章节、核心指令)
  3. 工具定义(完整列表、Schema)
  4. 权限系统(模式、分类器)
  5. 记忆/上下文管理机制
  6. 插件/扩展系统
  7. 配置与环境变量
  8. 可借鉴的设计模式

注意事项

  • GitHub API可能被限流,优先使用raw.githubusercontent.com
  • 闭源二进制的grep提取是近似的,可能有碎片化
  • strings命令在某些环境不可用,用grep -aoP替代
  • 二进制中的提示词可能是动态拼接的,提取的是片段而非完整提示词
  • 保存所有提取结果到/tmp/目录便于后续分析

输出格式

报告保存为 {workspace}/source-analysis-{project-name}.md,使用Markdown结构化格式。

版本历史

共 1 个版本

  • v1.0.0 初始版本:GitHub源码下载+二进制提示词提取+AI Agent架构分析 当前
    2026-05-11 21:45 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 668 📥 324,150
ai-intelligence

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,358 📥 318,341
ai-intelligence

ontology

oswalpalash
类型化知识图谱,用于结构化智能体记忆与可组合技能。支持创建/查询实体(人员、项目、任务、事件、文档)及关联...
★ 712 📥 243,815