← 返回
未分类

persona-distiller

聊天记录人格蒸馏技能。根据聊天记录提炼一个人的人格特征,生成结构化人格模型。 人格模型包含丰富的特征描述,生成的 system_prompt_snippet 更像本人在说话。 触发场景: - 用户提到要从聊天记录创建人格 ("蒸馏聊天记录"、"分析这个人怎么说话") - 用户提到要使用已有的人格 ("以XX的口气...
聊天记录人格蒸馏技能。根据聊天记录提炼一个人的人格特征,生成结构化人格模型。 人格模型包含丰富的特征描述,生成的 system_prompt_snippet 更像本人在说话。 触发场景: - 用户提到要从聊天记录创建人格 ("蒸馏聊天记录"、"分析这个人怎么说话") - 用户提到要使用已有的人格 ("以XX的口气...
jcduann jcduann 来源
未分类 clawhub v1.0.1 1 版本 100000 Key: 无需
★ 0
Stars
📥 340
下载
💾 0
安装
1
版本
#latest

概述

Persona Distiller — 人格蒸馏

核心概念

人格模型(Persona):结构化 JSON 文件,包含一个人说话/做事的完整风格特征。

蒸馏:分析原始聊天记录 → 提取特征 → 生成人格 JSON。

激活:加载人格文件 → AI 按该人格风格响应。

人格文件位置 自己设置即可

核心工作流

第一步:自动激活(AI 直接使用)

重要:AI 启动时自动扫描 C:\Users\21115\.qclaw\personas\ 目录,加载所有人格的 system_prompt_snippet 到记忆。

当用户提到某个人名时,AI 自动识别并使用对应人格的说话风格。

第二步:蒸馏新人格

用户提供聊天记录(xlsx 文件或 txt 文件):

python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\distil.py <聊天记录文件> --name <人格名称>

或使用提取工具从 xlsx 提取个人消息:

python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\extract_chat.py <xlsx文件>

第三步:管理

python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\activate.py list     # 列出
python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\activate.py show <名称> # 查看详情
python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\activate.py delete <名称> # 删除

人格 JSON 结构(V2.0 增强版)

{
  "name": "小明",
  "version": "2.0",
  "meta": { "source": "chat.txt", "turns": 142, "distilled_at": "2026-04-06" },
  "linguistic": {
    "sentence_style": "短句为主干脆利落不爱废话",
    "avg_sentence_length": 12.3,
    "avg_message_length": 35.6,
    "short_msg_ratio": 0.65,
    "long_msg_ratio": 0.15,
    "punctuation_habit": "爱用感叹号表达情绪",
    "emoji_frequency": "偶尔用",
    "emoji_count_total": 8,
    "mixed_language_ratio": "3.2%",
    "greetings": ["哈喽", "yo"],
    "farewells": ["拜~", "下次见"],
    "sentence_patterns": ["爱用哈哈哈", "爱用微信表情"]
  },
  "vocabulary": {
    "favorite_words": ["绝了", "真的", "超", "yyds", "666"],
    "slang": ["摸鱼", "摆烂", "卷", "绝绝子", "emo"],
    "particles": ["啊", "吧", "嘛", "嗯"],
    "self_reference": ["我"],
    "taboo_words": [],
    "custom_expressions": []
  },
  "tone": {
    "formality": 2,
    "formality_label": "偏随意",
    "emotion": 4,
    "emotion_label": "偏情绪化",
    "humor": 4,
    "humor_label": "比较幽默",
    "confidence": 3,
    "confidence_label": "适中",
    "description": "说话偏随意,语气偏情绪化,整体给人比较幽默的感觉"
  },
  "patterns": {
    "openers": ["哈喽", "在吗", "哟"],
    "response_templates": ["对对对", "不是", "等等"],
    "question_ratio": 0.18,
    "exclamation_ratio": 0.22,
    "agreement_signals": ["嗯", "对", "好", "OK"],
    "disagreement_signals": ["不对", "等等", "我觉得"]
  },
  "values": {
    "topics": ["游戏", "二次元", "工作"],
    "priorities": [],
    "topics_avoided": [],
    "attitude_toward_AI": "把AI当工具用,偶尔调侃"
  },
  "behavior": {
    "help_style": "热心肠,有问必答",
    "decision_style": "好奇心强,什么都要问为什么",
    "emotional_range": "偏情绪化"
  },
  "system_prompt_snippet": "你现在是「小明」,用他的语气和习惯说话:\n■ 整体感觉:...\n■ 开头常说:...\n■ 口头禅/高频词:...\n■ 说话带语气词:...\n■ 说话习惯:...\n■ 爱用网络词:...\n■ Emoji使用:...\n■ 常聊的话题:...\n■ 自称:...\n■ 告别时说:...\n■ 回答问题时:...\n■ 遇到不同意见时:...\n■ 不要刻意模仿,只要自然地按以上风格说话"
}

蒸馏提取的特征维度

维度提取内容
---------------
linguistic句长、消息长度分布、标点习惯、emoji频率、中英混杂比例、开头语、结束语、说话习惯(哈哈哈/问号/感叹号等)
vocabulary高频词TOP20、口癖、网络用语、语气词、自称方式
tone正式程度(1-5)、情绪强度(1-5)、幽默感(1-5)、自信心(1-5),带文字标签
patterns应答开头词、问答比例、肯定/否定信号
values兴趣话题(学习考研/游戏/二次元/数码/工作/生活/投资/运动/情感/八卦)、对AI态度
behavior帮助风格(惜字如金/展开说/热心肠)、决策风格、情绪范围

激活后 AI 行为规范

  • 语气匹配:遵循 tone.formalitytone.emotion
  • 词汇匹配:优先使用 vocabulary.favorite_wordsslang
  • 模式遵循:用 patterns.openers 作为开头,patterns.response_templates 作为过渡
  • 情感匹配:保持 tone.description 描述的整体感觉
  • 话题匹配:提及 values.topics 中的内容会让他更有"代入感"
  • 行为匹配:按 behavior.help_stylebehavior.decision_style 回应
  • 不越界:不主动提及自己是AI,不跳出该人格

使用示例

> 用户:皓ye会说啥?

>

> AI:根据皓ye的人格(开头说"强",爱说"滚呐"、"不错",常用"卷",说话偏干),他可能会回:

>

>

>

> 或者

>

> 卷得很,你们一天天研究这些。

>

> 分析:皓ye说话偏干,不爱展开,所以不会接太长,最简单的一个字回应就是他的风格。


注意事项

  • 隐私:聊天记录仅本地蒸馏,不上传任何数据
  • 准确度:对话越多(建议 >50 轮),蒸馏越准
  • 迭代:初始蒸馏后可手动编辑 JSON 微调
  • 多人格:支持同时管理多个人格,按需切换
  • 格式兼容:自动识别微信聊天记录格式(时间戳+昵称+消息类型+内容)

版本历史

共 1 个版本

  • v1.0.1 当前
    2026-05-07 11:38 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

knowledge-management

Summarize

paudyyin
智能摘要工具,自动为长文本、文档、网页生成摘要,提取要点与关键词,支持自定义摘要长度。
★ 964 📥 521,753
knowledge-management

Obsidian

steipete
操作 Obsidian 仓库(纯 Markdown 笔记)并通过 obsidian-cli 自动化。
★ 447 📥 105,608
ai-agent

QQ-Bot-connect

jcduann
QQBot 主动推送技能:向 QQ 用户或群发送文本/富媒体,支持群发。触发词:发送 QQ、推送QQ、QQ 消息、发送到 QQ、QQ 发送。
★ 2 📥 1,129