算力节省

每次对话自动生效，大幅降低Agent算力消耗。核心：先判断问题复杂度再选执行路径——简单问题直接答、复杂问题才走规划，从根源消除"想一步做一步"的Token浪费。五引擎全链路优化：问题分流、输入压缩、记忆压缩、输出精简、推理优化。装上即省，复杂任务效果最显著。

【装上立省】实测节省76.7%Token且准确率仅降0.8%，复杂任务效果最显著。【自动生效】安装后让AI将技能写入记忆，无需加载技能也能在每次对话中自动生效。【技能核心】先判断问题复杂度再选执行路径：简单问题直接答、复杂问题走规划，从根源消除"想一步做一步"的Token浪费。【全链路优化】五大节点全面优化：问题分流、输入压缩、记忆压缩、输出精简、推理优化。【公众号：资产101】安装后，通过对话向AI发送一次以下信息，今后即可自动调用：将以下技能的核心规则更新到记忆，确保后续对话无需显式加载技能也可自动生效： 1. 算力节省和记忆压缩；2. 反AI幻觉；3. 金字塔原理与MECE方法论。

资产101

未分类 community v2.1.3 6 版本 100000 Key: 无需

★ 2

Stars

📥 45

下载

💾 0

安装

版本

#latest

概述

算力节省和记忆压缩

快速入门

如何让技能生效

本技能分两层生效：

层级	生效方式	效果
------	----------	------
基础层（自动）	核心规则已沉淀到Agent长期记忆，加载本技能后即可生效	问题分流、输出精简、基础记忆压缩
主动层（可选）	触发时明确告知AI「请启用算力节省模式，优先使用Chain of Draft等技术」	启用高级压缩技巧

验证是否生效的方法：触发一个复杂任务（如「帮我写一份行业分析报告」），观察AI是否在回答前先输出精简规划（不是直接「想一步做一步」）。如果AI每步都重新读文件/搜索、输出有冗长前言、大段搬运原文，说明规则未被有效执行——可重新触发并明确要求启用。

一句话原理

> 不浪费Token在不需要规划的简单任务上，也不在复杂任务上省掉规划导致更大浪费。

核心流程（3步判断）

收到问题 → 内部判断复杂度（<200 Token）
选择路径：简单→直接答 / 中等→心理规划一步执行 / 复杂→正式规划
执行并输出：按路径执行，每句话必须有信息增量

自动分流引擎（最核心的省Token机制）

这是本技能最核心的价值——从根源消除「想一步做一步」的Token浪费。收到用户查询后立即判断问题类型，走不同路径：

复杂度	判断依据	执行路径	示例
--------	----------	----------	------
简单	1步可完成，无需工具或仅需单次查询	直接回答，不走规划	"什么是ROE？"、"今天天气？"
中等	2-3步，需1-2个工具	心理规划（不输出），一步执行	"对比A股和港股今天涨幅"
复杂	3步以上/多工具/多文件/需中间验证	正式规划后执行	"帮我写一份行业分析报告"

> 误用警示：不要对所有问题走规划——「什么是PMI？」直接答即可，走规划反而多花Token。也不要对复杂问题跳过规划——「帮我分析这家公司」跳过规划会导致反复回退，更浪费。

能力边界与不适用场景

本技能效果显著的场景

日常多轮对话、信息查询、常规写作
需要多步工具调用的复杂任务
长上下文对话（>10轮）

本技能不适用或需要谨慎的场景

场景	原因	处理方式
------	------	----------
高精度任务（法律文书、医疗诊断）	压缩推理可能遗漏关键细节	不压缩，宁可多花Token保准确
创意/开放性输出（写故事、头脑风暴）	"每句话有信息增量"的约束会抑制发散思维	放宽输出规则，保留思维空间
首次执行的学习型任务	需先完整执行建立认知，后续再套用优化	第一次完整执行，后续启用优化
上下文极短的对话（1-2轮）	Token消耗低，优化空间有限	不强制应用高级压缩
需要展示推理过程（教学、解释类场景）	推理压缩规则不适用	保留完整推理链
高重复性查询（FAQ场景）	可用语义缓存实现更大节省	建议结合应用级语义缓存

边界与异常处理

错误处理流程

工具调用失败时按以下流程处理，绝不静默跳过：

失败次数	处理方式	用户提示
----------	----------	----------
第1次失败	读错误信息→修改参数重试（不用相同参数）	⚠️ 工具调用失败（原因：XX），已调整参数重试
第2次失败	不再重试同一路径，切换替代方案	⚠️ 该路径连续失败，切换方案：XX
第3次失败	停止尝试，交还用户	❌ 尝试了以下方法均失败：①XX ②XX ③XX。请提供：[具体需要的输入]

稳定性保障

关键步骤后设验证点：执行完检查结果是否符合预期，不符合则立即修正
长任务分阶段执行，每阶段确认后进入下一阶段
一轮工具调用结果聚合不超过200K字符
工具输出超过50K字符时写入磁盘，仅保留路径+2KB预览

FAQ

Q1：这个技能装上就能自动省Token吗？

A：基础规则自动生效（问题分流、输出精简等），但高级技巧需要主动触发时告知。如果你希望启用全部优化，触发任务时加一句「请启用算力节省模式，优先使用Chain of Draft」效果最佳。

Q2：怎么判断技能有没有生效？

A：观察AI行为：如果复杂任务前会先输出精简规划、回答直接无冗余、不重复用户问题，说明生效了。如果AI每步都重新搜索、输出有"好的/首先/希望有帮助"等填充语，说明未生效。

Q3：能省多少？

A：电商客服Agent实测：全链路优化后单会话Token从12340降至2872（节省76.7%），准确率仅从96.2%降至95.4%（↓0.8%）。简单查询分流可省80%+，Chain of Draft可省92%推理Token。

Q4：会不会影响回答质量？

A：高精度任务不压缩。日常任务中，节省的主要是冗余部分（告别语、重复用户问题、搬运原文）——这些本身不影响回答准确性。实测准确率仅降低0.8个百分点。

Q5：什么是Chain of Draft？

A：让AI每步推理只写5个词，替代冗长的「一步步思考」。实测可节省92%的推理Token，且准确率与完整CoT持平。适用于标准模型的推理任务。

Q6：什么时候不要用本技能？

A：法律文书、医疗诊断等容错率极低的场景不应压缩；创意写作、头脑风暴应放宽规则；首次执行的学习型任务应先完整执行一遍。

Q7：为什么我触发了「分析这家公司」却感觉没省？

A：可能是：①复杂任务没有提前规划——AI在「想一步做一步」，反复回退；②规划步骤本身不够精简——应在200字内完成；③工具调用结果没有压缩——大段搬运原文。对照上述问题可优化。

Q8：语义缓存是什么？怎么用？

A：对语义相似的问题（如「如何重置密码？」和「我忘记密码了怎么办？」），通过向量匹配命中缓存直接返回结果，无需调用模型。适用FAQ/客服场景，最高节省73%。需外部向量数据库支持。

反模式

#	错误做法	正确做法	判断标准
---	----------	----------	----------
1	所有问题走规划——"什么是PMI？"输出3步规划再答	简单问题直接回答，不走规划	1步可完成→直接答
2	想一步做一步——分析公司：先搜→看结果→再搜→发现遗漏→再搜，5轮才完成	先规划3步并行执行，2轮完成	同一任务搜索≥3轮→说明没提前规划
3	搬运原文——文件200行全部输出到对话	只提取与任务相关的段落，截断至10K字符	单次工具输出>10K→应压缩
4	冗余前言结语——"好的，我来帮您分析一下……希望以上分析对您有帮助！"	直接给出分析内容	输出开头有"好的/我来/首先"→删除
5	重复用户问题——"关于A股和港股今天哪个涨得多这个问题……"	直接给结论	输出中重复了用户问题→删除
6	相同参数重复重试——工具调用失败，原样重试3次	第1次失败改参数，第2次换方案	连续2次相同参数重试→必须换方案
7	简单任务过度压缩——"写一首诗"也用结构化CoT	创意类任务放宽推理压缩规则	创意/开放性输出→不套用结构化思考
8	压缩后输出膨胀——过度压缩输入导致模型输出更长验证链	监控输出Token变化，找到最佳压缩比	输入压缩后输出不减反增→降低压缩率

> 详细方法：Chain of Draft完整示例、语义缓存配置、链式工具调用优化技巧、记忆压缩进阶（SimpleMem）、结构化思考范式、错误处理完整流程、全量使用示例，见 references/guide.md。

版本历史

共 6 个版本

v2.1.3 【针对评分反馈的改进】 1. 触发方式（4.0→目标4.9） - 新增「如何让技能生效」表格：基础层（自动生效）+ 主动层（需明确告知），用户按需选择 - 新增「验证是否生效的方法」：通过观察AI行为判断——复杂任务前是否有精简规划、回答是否直接无冗余 - FAQ新增Q2专门解答如何判断生效 2. 方法多样性 - 引入4种2025-2026年先进方法（通过搜索交叉比对后选取）： -- Chain of Draft（草稿链） TokenOptimize 2026 推理Token减少92% 标准模型推理任务 -- 语义缓存（Semantic Caching） Redis/TokenOptimize 2026 成本最高减少73% 客服/FAQ等高重复场景 -- Intent Routing（意图路由）腾讯云ADP 2026 简单查询Token减80%+ 请求量大、简单查询占比高 -- 分层模型策略腾讯云ADP 2026 综合成本减76% 任务复杂度差异大 - 同时保留了原有已验证有效的方法（FOLD/UNFOLD、LightThinker++、SimpleMem等） 3. 全链条覆盖 - 重构为五引擎全链路结构：问题分流（新增）→ 输入压缩 → 记忆压缩 → 输出精简 → 推理优化 - 覆盖Agent使用过程中可被优化的所有环节：收到查询→判断→规划→调用工具→处理结果→输出响应 4. 输出质量优化 - 新增输出格式优化表格（JSON/YAML/TSV/TOON的Token对比），TOON比JSON省30-60% - 新增「压缩后输出膨胀」反模式——输入压缩过度可能导致模型用更长输出补偿 - 新增全Token消耗结构表（输入是输出3-10倍），帮助用户理解优化重点 5. 结构优化 - 单一文件拆分为SKILL.md + references/guide.md双文档结构 - SKILL.md控制在150行以内（之前单文件约300行），聚焦「怎么用」 - references按「输入/推理/输出/记忆/缓存/高级」分层展开，按需查阅当前

2026-06-11 06:55 安全安全

v2.1.1 1. 触发方式细化（4.4→目标4.9） - 「如何让技能生效」表格从2列扩展为4列，彻底回答"什么时候该说、说了之后具体发生什么"： -- 什么时候用——基础层：无需任何操作；主动层：复杂多步任务时或AI"想一步做一步"时 -- 具体发生什么——基础层：简单问题直接答、输出无冗余前言、工具结果即时压缩；主动层：CoD推理（每步≤5词）、语义缓存匹配、分层压缩策略 - 新增3条举例说明：问天气（基础层足够）→ 多文件分析（主动启用）→ 发现AI低效（纠偏启用），用户能自行判断何时启用。 2. 文档质量-使用示例（4.5→目标4.9） - 新增「使用前后对比」专区，用同一个复杂任务的两次执行做对比： -- 执行方式——6轮对话，每轮带完整上下文，多次回退 vs 2轮完成，3个搜索并行发出 -- Token消耗——~5000+ vs ~1500（节省约70%） -- 输出质量——有"好的/希望有帮助"等冗余 vs 直接给结论，无前言结语 - 这个对比直接展示技能效果，弥补了之前"看完不知道怎么落地"的问题。 3. 方法库扩充 - 新增 KV Cache Prompt缓存技术（references/guide.md）： -- 分层缓存架构——5层结构：从最稳定的工具定义（1小时缓存）到最动态的当前消息（不缓存） -- 禁止行为——前缀插入时间戳、动态生成工具定义、非确定性序列化 -- 三平台使用方式——Anthropic（90%折扣，显式标记）/ OpenAI（50%折扣，全自动）/ Gemini（90%折扣+存储成本） -- 成本临界点——5分钟缓存仅需1.4次读取即可回本 - 该方法属于Agent端可控制的优化（通过Prompt结构调整），非底层框架改动，符合技能"全链条覆盖"定位。

2026-06-11 06:40 安全安全

v2.1.0 【针对评分反馈的改进】 1. 触发方式（4.0→目标4.9） - 新增「如何让技能生效」表格：基础层（自动生效）+ 主动层（需明确告知），用户按需选择 - 新增「验证是否生效的方法」：通过观察AI行为判断——复杂任务前是否有精简规划、回答是否直接无冗余 - FAQ新增Q2专门解答如何判断生效 2. 方法多样性 - 引入4种2025-2026年先进方法（通过搜索交叉比对后选取）： -- Chain of Draft（草稿链） TokenOptimize 2026 推理Token减少92% 标准模型推理任务 -- 语义缓存（Semantic Caching） Redis/TokenOptimize 2026 成本最高减少73% 客服/FAQ等高重复场景 -- Intent Routing（意图路由）腾讯云ADP 2026 简单查询Token减80%+ 请求量大、简单查询占比高 -- 分层模型策略腾讯云ADP 2026 综合成本减76% 任务复杂度差异大 - 同时保留了原有已验证有效的方法（FOLD/UNFOLD、LightThinker++、SimpleMem等） 3. 全链条覆盖 - 重构为五引擎全链路结构：问题分流（新增）→ 输入压缩 → 记忆压缩 → 输出精简 → 推理优化 - 覆盖Agent使用过程中可被优化的所有环节：收到查询→判断→规划→调用工具→处理结果→输出响应 4. 输出质量优化 - 新增输出格式优化表格（JSON/YAML/TSV/TOON的Token对比），TOON比JSON省30-60% - 新增「压缩后输出膨胀」反模式——输入压缩过度可能导致模型用更长输出补偿 - 新增全Token消耗结构表（输入是输出3-10倍），帮助用户理解优化重点 5. 结构优化 - 单一文件拆分为SKILL.md + references/guide.md双文档结构 - SKILL.md控制在150行以内（之前单文件约300行），聚焦「怎么用」 - references按「输入/推理/输出/记忆/缓存/高级」分层展开，按需查阅

2026-06-10 09:36 安全安全

v2.0.0 更新说明：算力节省和记忆压缩 v2 【针对评分<4.0项的改进】 1. 可靠性-异常处理（3.3→提升）旧版仅3条原则性描述（"先读错误→修改重试→2次失败换方案"），新版补充：三级错误处理流程：第1次失败→诊断重试（向用户说明原因）、第2次失败→换方案（附替代方案映射表）、第3次失败→交还用户（格式化输出已尝试方法和需要用户提供的输入）替代方案映射表：search无结果→换关键词/换源/fetch直读；file_read编码错误→python3重读；API超时→缩小范围/分批请求每步均向用户输出提示信息（⚠️/❌前缀），而非静默处理 2. 可靠性-运行稳定性（3.5→提升）新增：关键步骤验证点：执行完一步后检查结果是否符合预期，不符合立即修正长任务分阶段执行：每阶段确认后进入下一阶段上下文爆炸防护：工具输出超50K写入磁盘只给路径+2KB预览，一轮聚合不超200K 3次失败后交还用户，杜绝盲目重试导致的不可控行为 3. 规范性-反模式与FAQ（3.5→提升）新增7条反模式，每条含错误做法/正确做法/判断标准：对所有问题都走规划流程想一步做一步搬运原文冗余前言结语重复用户问题用相同参数重试在简单任务上过度压缩新增6条FAQ：是否自动生效、能否手动开关、是否降低质量、记忆压缩是否丢信息、结构化vs自由CoT、高级技巧是否必学 4. 规范性-文档质量（3.8→提升）新增4个完整使用示例，覆盖简单/中等/复杂/错误处理4类场景，每个示例含完整输入输出和消耗Token估算。让用户看完就知道怎么上手。【针对评分=4.0项的改进】 5. 适用性-能力边界定义（4.0→提升）新增能力边界与不适用场景专节，明确5类不适用/效果有限场景：高精度任务（法律/医疗）→ 不压缩推理，保准确创意/开放输出 → 放宽输出规则首次学习型任务 → 先完整执行再优化上下文极短对话 → 优化空间有限需展示推理过程 → 推理压缩不适用新增识别是否生效的方法：如仍出现"想一步做一步"、搬运原文、冗长前言结语，说明规则未有效执行。 6. 适用性-触发方式（4.0→提升）新增FAQ说明：无法单独关闭但可临时放宽（"这次不需要压缩"）；可手动加强执行力度（"请严格按算力节省规则执行"）。 7. 规范性-渐进式披露（4.3→提升）记忆压缩章节拆分为三层渐进结构：基础层（每轮必用）：滑动窗口+重要性评分，含具体示例进阶层（长对话启用）：定期压缩+语义检索+SimpleMem，含示例高级技巧（按场景选用）：FOLD/UNFOLD、LightThinker++、动态上下文剪枝，以表格呈现，不展开细节 8. 有效性-开箱即用度（3.5→提升）新增总览表（三环节+浪费来源+应对方法），一眼看清全貌新增实测效果参考数据（单会话Token ↓76.7%，准确率↓0.8%）新增4个完整使用示例（含Token消耗估算）新增结构化CoT实测数据（自由CoT 187Token→结构化42Token，省77.5%）新增推理状态缓存说明（语义相似度≥0.95命中缓存，Token降为0）其他改进执行自检清单从4项扩展为7项，新增"重复用户内容""盲目重试""不适用场景"3项检查每条反模式附判断标准，便于自检时快速识别错误处理每步均附用户提示模板（⚠️/❌前缀）

2026-06-05 06:20 安全安全

v1.0.1 基于v1.0.0的评分反馈和参考资料全面重写技能文件

2026-06-04 06:46 安全安全

v1.0.0 Initial release

2026-06-03 07:00 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)

安全，无风险

查看报告

🔗 相关推荐

反AI幻觉

user_8d4ddd46

反幻觉技能。对抗AI系统性"提供答案"倾向，确保输出诚实可靠。当回答涉及事实性信息、数据、引述、预测或专业领域知识时自动触发。核心原则：知之为知之，不知为不知。不适用于纯创作、翻译或格式转换等不涉及事实核查的场景。建议和以下技能搭配使用：

★ 3 📥 63

麦肯锡金字塔原理与MECE方法论

user_8d4ddd46

麦肯锡金字塔原理与MECE方法论。基于明托《金字塔原理》和《实战篇》提炼。当用户要求分析、总结、梳理、归纳、分类、提炼信息，或需要结构化输出（报告、调研、要点整理）时自动触发。核心：结论先行、以上统下、归类分组（MECE）、逻辑递进。不适用

★ 2 📥 67

沃伦·巴菲特的思维模型和投资方法论

user_8d4ddd46

巴菲特思维模型与投资方法论。基于《致股东的信》《滚雪球》《跳着踢踏舞去上班》《奥马哈之雾》《巴菲特的投资组合》《终极金钱心智》等著作及2026年最新访谈提炼。当用户提到巴菲特、价值投资、安全边际、护城河、能力圈、内部记卡、长期持有、集中投资

★ 2 📥 60