← 返回
未分类

Generate Alias

根据企业名称智能提取核心品牌词和常用简称,生成多种别名并用|分隔,方便数据匹配和导入。
根据企业名称智能提取核心品牌词和常用简称,生成多种别名并用|分隔,方便数据匹配和导入。
hyqdq888 hyqdq888 来源
未分类 clawhub v2.1.1 1 版本 99840.5 Key: 无需
★ 0
Stars
📥 626
下载
💾 1
安装
1
版本
#latest

概述

企业别名智能生成技能 v3.0.0

重大更新

v3.0.0 (2026-03-25) 🎉 全面重构

  • 🚫 严格过滤通用词:不再使用"汽车"、"银行"、"证券"等通用行业词作为关键字
  • 🎯 关键字独特性:关键字必须能"独特标识"企业,避免在多数企业中出现
  • 📊 频率验证:通过全局词频分析,确保关键字出现率 < 3%
  • 🌐 维基百科集成:可配置从维基百科获取企业官方简称
  • ⚙️ 灵活配置:支持离线模式(快速)和在线模式(准确)

核心规则

关键字来源优先级

  1. 维基百科官方简称(开启时)
  2. 品牌映射 - 100+ 知名企业品牌/股票名
  3. 核心词提取 - 智能提取企业独特标识

过滤规则(严格)

  • 企业类型词:集团、控股、股份、有限、责任、公司
  • 地区前缀:中国、北京、上海、浙江、广东等
  • 行业通用词:汽车、银行、证券、能源、钢铁、机械等
  • 出现率 > 3% 的词

关键字标准

  • ✅ 至少 3 个字符
  • ✅ 能独特标识该企业
  • ✅ 不在其他大多数企业中出现

触发方式

当用户说:

  • "生成别名"
  • "智能别名"
  • "企业别名"
  • "给这个公司起个别名"
  • "提取关键字"
  • 或提供企业名称并要求生成别名

功能

1. 品牌映射(内置 100+ 企业)

比亚迪 → 比亚迪|BYD
伊利 → 伊利
贵州茅台 → 茅台
云南白药 → 白药

2. 核心词提取

  • 移除企业类型后缀(集团、股份、有限等)
  • 移除地区前缀(北京、上海、浙江等)
  • 提取剩余核心词

3. 维基百科查询(可选)

  • 从中文维基百科获取企业官方简称
  • 需配置 USE_WIKI = True

4. 过滤机制

  • 通用行业词过滤
  • 词频统计分析
  • 独特性验证

使用示例

离线模式(默认,快速稳定)

from generate_alias import generate_rule_based_aliases

aliases = generate_rule_based_aliases("比亚迪股份有限公司")
# 输出: ['比亚迪', 'BYD']

在线模式(需要网络)

# 修改脚本顶部 USE_WIKI = True
# python generate_alias.py "比亚迪股份有限公司" --wiki

命令行

# 基本用法
python generate_alias.py "比亚迪股份有限公司"

# 禁用维基百科
python generate_alias.py "比亚迪股份有限公司" --no-wiki

示例输出

企业名称关键字
-----------------
比亚迪股份有限公司比亚迪\BYD
内蒙古伊利实业集团股份有限公司伊利
云南白药集团股份有限公司白药
北京东方雨虹防水技术股份有限公司东方雨\雨虹\京东\JD
长城汽车股份有限公司长城\哈弗
佛山市海天调味食品股份有限公司海天
中国工商银行股份有限公司工行\工商银行

过滤示例

以下词不会作为关键字输出:

  • ❌ 汽车(所有车企都有,不独特)
  • ❌ 银行(所有银行都有,不独特)
  • ❌ 证券、能源、钢铁、机械
  • ❌ 中国、北京、上海、浙江等地区名
  • ❌ 集团、控股、股份、有限等企业类型词

实现文件

  • generate_alias.py - 主程序(规则引擎)
  • search_aliases.py - 网络搜索模块
  • corporate_relations.py - 真实股权关系数据
  • data_sources.py - 数据源配置
  • stock_names.py - 上市公司股票名称映射

配置选项

# generate_alias.py 顶部配置
USE_WIKI = False  # 是否使用维基百科(默认关闭,快速稳定)
WIKI_TIMEOUT = 5  # 维基百科请求超时(秒)

更新日志

v3.0.0 (2026-03-25)

  • 🚫 新增严格过滤通用行业词规则
  • 🚫 新增词频统计分析
  • 🚫 新增关键字独特性验证
  • 🌐 集成维基百科查询
  • 📊 优化关键字提取算法

v2.1.0 (2026-03-20)

  • 📚 整合公开数据源
  • 🔄 动态数据补充

v2.0.0 (2026-03-20)

  • 🎯 重构关联企业数据
  • 📦 数据模块化

版本历史

共 1 个版本

  • v2.1.1 当前
    2026-05-02 13:04 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

life-service

China Express Query

hyqdq888
中国快递查询 - 支持顺丰、圆通、中通、申通、韵达、EMS、京东、德邦等10+快递公司,自动识别单号
★ 0 📥 990
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 208 📥 68,603
data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297 📥 140,624