企业信息调研 Skill v5.2 · 金蝶灵境风格 · 纯 AI 提取架构
功能概述
接收用户输入的企业名称,通过 AI 主搜 + Tavily 增强二层架构 从公开网络获取工商信息、业务规模、行业地位、行业趋势、财务数据及数字化系统(ERP、CRM、WMS、TMS 等 14 个系统),生成结构化的 金蝶灵境风格 HTML 调研报告。零配置开箱即用。报告兼容 PC、平板、移动端、折叠屏。
适用场景:
- ERP 销售/售前背调、合作伙伴资质审查、竞品分析、行业洞察
🔒 安全合规声明
所有操作仅用于合法的公开信息搜索:
urllib 调用 Tavily Search API(可选增强),无 Key 不发起请求- 读取
.env 或环境变量获取 TAVILY_API_KEY - 不执行系统命令、不修改文件、不收集隐私、不使用正则(v5.2 纯 AI 提取)
🚨 核心行为准则(强制)
严禁编造任何数据,所有输出必须基于真实搜索结果:
- 来源可溯:每个字段内部记录来源 URL 或摘要,无来源则不输出该字段(改为“暂未获取”)。
- 确定性填充:
- 明确存在 → 直接使用
- 模糊无具体数值 → “【模糊描述】”并加注来源
- 未提及 → 必须填“暂未获取”,禁止推测
- 可信度分级:
- 高可信:gov.cn、qichacha、天眼查、公司年报/公告
- 中可信:新浪财经、36氪、垂直媒体(注明引用)
- 低可信:个人博客、论坛 → 仅在无其他来源时降级使用,并标注“待核实”
🧠 内置 COT 推理流程(7 步,模型内部执行)
- 企业名称标准化:搜索“<企业名> 统一社会信用代码”或官网,确定官方全称。
- 并行搜索 11 个维度(由 AI 内置搜索工具执行):
- 工商信息、业务概况、品牌产品、技术实力、市场客户
- 数字化系统、数字化厂商与项目、高管团队、行业洞察与趋势
- 竞争对手与关联、财务数据(如上市)
- 可信度评估与提取:判断来源可信度,提取关键字段,记录来源 URL。
- 交叉验证:同一字段多源不一致时优先企业年报或工商最新公示。
- 缺失字段统一处理:遍历所有目标字段,未找到任何信息标记为
MISSING_DATA,最终转为“暂未获取”。 - AI 直接提取结构化数据:AI 阅读全部搜索结果,直接构建 JSON 字典(示例见附表),传入
html_generator.py 生成报告。不调用正则、不调用 query_enterprise。 - 调用生成器输出 HTML:将数据传给
scripts/html_generator.py 的 generate_html(),缺失字段一律显示“暂未获取”。报告末尾显示数据完整度统计。
输入与调用方式
| 参数 | 类型 | 必填 | 说明 |
|---|
| ------ | ------ | ------ | ------ |
company_name | string | 是 | 企业全称或关键字(建议全称) |
支持命令式、口语化请求,例如:“帮我查一下华为”、“做一份金蝶国际的企业背景调查报告”。
输出格式(金蝶灵境风格 HTML)
生成完整 HTML 页面,包含以下板块,字段缺失一律填“暂未获取”:
- 企业基础信息:统一社会信用代码、法定代表人、注册资本、实缴资本、成立日期、经营状态、登记机关、企业类型、所属行业、注册地址、经营范围
- 行业洞察及趋势:市场规模、增长动力、政策影响、发展趋势、竞争格局、技术方向(≥30-50 字/维度)
- 公司简介:企业概况、发展历程、企业文化、荣誉资质
- 核心高管:姓名、职务(头像首字展示)
- 数字化应用系统:14 类系统(ERP、CRM、MES、WMS、TMS、BI、SRM、PLM、SCM、OA、HRM、QMS、EAM、APS),已部署显示“已部署”及厂商名(若无显示“厂商未知”),未部署显示“未部署”
- 财务数据(仅上市公司):营收、净利润、毛利率、ROE 及近 3-4 年对比表(含同比环比),标注数据来源
- 主营业务与行业地位、品牌与产品、技术实力、市场与客户
- 热门关联信息:产业链位置、竞争对手、合作伙伴、近期热点
数字化系统提取规则
采用系统-厂商映射识别 14 类系统、100+ 常见厂商关键词:
- 未出现系统关键词 → “未部署”
- 出现系统关键词但无已知厂商 → “已部署” + 报告显示“厂商未知”
- 出现系统关键词且匹配厂商 → 输出厂商名(如“金蝶云·星空”)
异常处理与防幻觉护栏
- 企业未找到 → 返回提示页,禁止猜测任何信息
- 搜索服务异常 → 显示“搜索服务异常,无法获取数据”
- 部分字段缺失 → 一律填“暂未获取”,不替换模糊词
- 数据完整度:报告末尾显示“本报告基于公开搜索,数据完整度:X/N 字段有明确来源,其余为暂未获取。”
数据源与提取策略(纯 AI 提取架构 v5.2)
唯一路径:AI 直接理解搜索结果
- AI 使用内置搜索工具并行搜索 11 个维度
- AI 直接理解所有搜索结果,构建结构化 JSON
- 传入
html_generator.py 生成报告
可选增强:Tavily API
配置 TAVILY_API_KEY 后,自动对工商/财务/数字化 3 个核心维度补充搜索,AI 统一理解增强结果。
- 获取 Key:https://tavily.com/ 注册,免费额度约 1000 次/月
- 无 Key 时完全可用,报告顶部显示轻提示建议配置
搜索维度清单:basic(工商)、business(业务)、brand(品牌产品)、tech(技术)、market(市场客户)、digital(数字化系统)、digital_vendor(厂商项目)、executive(高管)、industry(行业趋势)、related(竞争对手/伙伴)、finance(财务)
多端自适应设计
报告兼容 PC、平板、折叠屏、手机,通过 CSS 断点适配布局(≤768px、≤600px、≤480px)。
使用示例
/enterprise_info 深圳市共进电子股份有限公司
text
生成报告含完整财务数据及数字化系统详情。
依赖与零配置
- 无需任何 API Key 即可使用(AI 内置搜索覆盖全部维度)
- 可选 Tavily API Key 提升工商/财务/数字化精确度
- 无需额外 Python 包
配套资源
scripts/html_generator.py:HTML 报告生成器(数据清洗、缺失统一显示)templates/report-css-v4.css:金蝶灵境独立样式templates/report-html-v4.html:HTML 结构模板
版本历史
v5.2 纯 AI 提取架构(去除正则),v5.1 二层架构重构,v4.2 起引入 AI 搜索与行业洞察。