← 返回
未分类

算力节省

每次对话自动生效,大幅降低Agent算力消耗。核心:先判断问题复杂度再选执行路径——简单问题直接答、复杂问题才走规划,从根源消除"想一步做一步"的Token浪费。五引擎全链路优化:问题分流、输入压缩、记忆压缩、输出精简、推理优化。装上即省,复杂任务效果最显著。
【装上立省】实测节省76.7%Token且准确率仅降0.8%,复杂任务效果最显著。 【自动生效】安装后让AI将技能写入记忆,无需加载技能也能在每次对话中自动生效。 【技能核心】先判断问题复杂度再选执行路径:简单问题直接答、复杂问题走规划,从根源消除"想一步做一步"的Token浪费。 【全链路优化】五大节点全面优化:问题分流、输入压缩、记忆压缩、输出精简、推理优化。 【公众号:资产101】 安装后,通过对话向AI发送一次以下信息,今后即可自动调用: 将以下技能的核心规则更新到记忆,确保后续对话无需显式加载技能也可自动生效: 1. 算力节省和记忆压缩;2. 反AI幻觉;3. 金字塔原理与MECE方法论。
资产101
未分类 community v2.1.3 6 版本 100000 Key: 无需
★ 2
Stars
📥 45
下载
💾 0
安装
6
版本
#latest

概述

算力节省和记忆压缩

快速入门

如何让技能生效

本技能分两层生效:

层级生效方式效果
----------------------
基础层(自动)核心规则已沉淀到Agent长期记忆,加载本技能后即可生效问题分流、输出精简、基础记忆压缩
主动层(可选)触发时明确告知AI「请启用算力节省模式,优先使用Chain of Draft等技术」启用高级压缩技巧

验证是否生效的方法:触发一个复杂任务(如「帮我写一份行业分析报告」),观察AI是否在回答前先输出精简规划(不是直接「想一步做一步」)。如果AI每步都重新读文件/搜索、输出有冗长前言、大段搬运原文,说明规则未被有效执行——可重新触发并明确要求启用。

一句话原理

> 不浪费Token在不需要规划的简单任务上,也不在复杂任务上省掉规划导致更大浪费。

核心流程(3步判断)

  1. 收到问题 → 内部判断复杂度(<200 Token)
  2. 选择路径:简单→直接答 / 中等→心理规划一步执行 / 复杂→正式规划
  3. 执行并输出:按路径执行,每句话必须有信息增量

自动分流引擎(最核心的省Token机制)

这是本技能最核心的价值——从根源消除「想一步做一步」的Token浪费。收到用户查询后立即判断问题类型,走不同路径:

复杂度判断依据执行路径示例
----------------------------------
简单1步可完成,无需工具或仅需单次查询直接回答,不走规划"什么是ROE?"、"今天天气?"
中等2-3步,需1-2个工具心理规划(不输出),一步执行"对比A股和港股今天涨幅"
复杂3步以上/多工具/多文件/需中间验证正式规划后执行"帮我写一份行业分析报告"

> 误用警示:不要对所有问题走规划——「什么是PMI?」直接答即可,走规划反而多花Token。也不要对复杂问题跳过规划——「帮我分析这家公司」跳过规划会导致反复回退,更浪费。


能力边界与不适用场景

本技能效果显著的场景

  • 日常多轮对话、信息查询、常规写作
  • 需要多步工具调用的复杂任务
  • 长上下文对话(>10轮)

本技能不适用或需要谨慎的场景

场景原因处理方式
----------------------
高精度任务(法律文书、医疗诊断)压缩推理可能遗漏关键细节不压缩,宁可多花Token保准确
创意/开放性输出(写故事、头脑风暴)"每句话有信息增量"的约束会抑制发散思维放宽输出规则,保留思维空间
首次执行的学习型任务需先完整执行建立认知,后续再套用优化第一次完整执行,后续启用优化
上下文极短的对话(1-2轮)Token消耗低,优化空间有限不强制应用高级压缩
需要展示推理过程(教学、解释类场景)推理压缩规则不适用保留完整推理链
高重复性查询(FAQ场景)可用语义缓存实现更大节省建议结合应用级语义缓存

边界与异常处理

错误处理流程

工具调用失败时按以下流程处理,绝不静默跳过

失败次数处理方式用户提示
------------------------------
第1次失败读错误信息→修改参数重试(不用相同参数)⚠️ 工具调用失败(原因:XX),已调整参数重试
第2次失败不再重试同一路径,切换替代方案⚠️ 该路径连续失败,切换方案:XX
第3次失败停止尝试,交还用户❌ 尝试了以下方法均失败:①XX ②XX ③XX。请提供:[具体需要的输入]

稳定性保障

  • 关键步骤后设验证点:执行完检查结果是否符合预期,不符合则立即修正
  • 长任务分阶段执行,每阶段确认后进入下一阶段
  • 一轮工具调用结果聚合不超过200K字符
  • 工具输出超过50K字符时写入磁盘,仅保留路径+2KB预览

FAQ

Q1:这个技能装上就能自动省Token吗?

A:基础规则自动生效(问题分流、输出精简等),但高级技巧需要主动触发时告知。如果你希望启用全部优化,触发任务时加一句「请启用算力节省模式,优先使用Chain of Draft」效果最佳。

Q2:怎么判断技能有没有生效?

A:观察AI行为:如果复杂任务前会先输出精简规划、回答直接无冗余、不重复用户问题,说明生效了。如果AI每步都重新搜索、输出有"好的/首先/希望有帮助"等填充语,说明未生效。

Q3:能省多少?

A:电商客服Agent实测:全链路优化后单会话Token从12340降至2872(节省76.7%),准确率仅从96.2%降至95.4%(↓0.8%)。简单查询分流可省80%+,Chain of Draft可省92%推理Token。

Q4:会不会影响回答质量?

A:高精度任务不压缩。日常任务中,节省的主要是冗余部分(告别语、重复用户问题、搬运原文)——这些本身不影响回答准确性。实测准确率仅降低0.8个百分点。

Q5:什么是Chain of Draft?

A:让AI每步推理只写5个词,替代冗长的「一步步思考」。实测可节省92%的推理Token,且准确率与完整CoT持平。适用于标准模型的推理任务。

Q6:什么时候不要用本技能?

A:法律文书、医疗诊断等容错率极低的场景不应压缩;创意写作、头脑风暴应放宽规则;首次执行的学习型任务应先完整执行一遍。

Q7:为什么我触发了「分析这家公司」却感觉没省?

A:可能是:①复杂任务没有提前规划——AI在「想一步做一步」,反复回退;②规划步骤本身不够精简——应在200字内完成;③工具调用结果没有压缩——大段搬运原文。对照上述问题可优化。

Q8:语义缓存是什么?怎么用?

A:对语义相似的问题(如「如何重置密码?」和「我忘记密码了怎么办?」),通过向量匹配命中缓存直接返回结果,无需调用模型。适用FAQ/客服场景,最高节省73%。需外部向量数据库支持。


反模式

#错误做法正确做法判断标准
---------------------------------
1所有问题走规划——"什么是PMI?"输出3步规划再答简单问题直接回答,不走规划1步可完成→直接答
2想一步做一步——分析公司:先搜→看结果→再搜→发现遗漏→再搜,5轮才完成先规划3步并行执行,2轮完成同一任务搜索≥3轮→说明没提前规划
3搬运原文——文件200行全部输出到对话只提取与任务相关的段落,截断至10K字符单次工具输出>10K→应压缩
4冗余前言结语——"好的,我来帮您分析一下……希望以上分析对您有帮助!"直接给出分析内容输出开头有"好的/我来/首先"→删除
5重复用户问题——"关于A股和港股今天哪个涨得多这个问题……"直接给结论输出中重复了用户问题→删除
6相同参数重复重试——工具调用失败,原样重试3次第1次失败改参数,第2次换方案连续2次相同参数重试→必须换方案
7简单任务过度压缩——"写一首诗"也用结构化CoT创意类任务放宽推理压缩规则创意/开放性输出→不套用结构化思考
8压缩后输出膨胀——过度压缩输入导致模型输出更长验证链监控输出Token变化,找到最佳压缩比输入压缩后输出不减反增→降低压缩率

> 详细方法:Chain of Draft完整示例、语义缓存配置、链式工具调用优化技巧、记忆压缩进阶(SimpleMem)、结构化思考范式、错误处理完整流程、全量使用示例,见 references/guide.md

版本历史

共 6 个版本

  • v2.1.3 【针对评分反馈的改进】 1. 触发方式(4.0→目标4.9) - 新增「如何让技能生效」表格:基础层(自动生效)+ 主动层(需明确告知),用户按需选择 - 新增「验证是否生效的方法」:通过观察AI行为判断——复杂任务前是否有精简规划、回答是否直接无冗余 - FAQ新增Q2专门解答如何判断生效 2. 方法多样性 - 引入4种2025-2026年先进方法(通过搜索交叉比对后选取): -- Chain of Draft(草稿链) TokenOptimize 2026 推理Token减少92% 标准模型推理任务 -- 语义缓存(Semantic Caching) Redis/TokenOptimize 2026 成本最高减少73% 客服/FAQ等高重复场景 -- Intent Routing(意图路由) 腾讯云ADP 2026 简单查询Token减80%+ 请求量大、简单查询占比高 -- 分层模型策略 腾讯云ADP 2026 综合成本减76% 任务复杂度差异大 - 同时保留了原有已验证有效的方法(FOLD/UNFOLD、LightThinker++、SimpleMem等) 3. 全链条覆盖 - 重构为五引擎全链路结构:问题分流(新增)→ 输入压缩 → 记忆压缩 → 输出精简 → 推理优化 - 覆盖Agent使用过程中可被优化的所有环节:收到查询→判断→规划→调用工具→处理结果→输出响应 4. 输出质量优化 - 新增输出格式优化表格(JSON/YAML/TSV/TOON的Token对比),TOON比JSON省30-60% - 新增「压缩后输出膨胀」反模式——输入压缩过度可能导致模型用更长输出补偿 - 新增全Token消耗结构表(输入是输出3-10倍),帮助用户理解优化重点 5. 结构优化 - 单一文件拆分为SKILL.md + references/guide.md双文档结构 - SKILL.md控制在150行以内(之前单文件约300行),聚焦「怎么用」 - references按「输入/推理/输出/记忆/缓存/高级」分层展开,按需查阅 当前
    2026-06-11 06:55 安全 安全
  • v2.1.1 1. 触发方式细化(4.4→目标4.9) - 「如何让技能生效」表格从2列扩展为4列,彻底回答"什么时候该说、说了之后具体发生什么": -- 什么时候用——基础层:无需任何操作;主动层:复杂多步任务时或AI"想一步做一步"时 -- 具体发生什么——基础层:简单问题直接答、输出无冗余前言、工具结果即时压缩;主动层:CoD推理(每步≤5词)、语义缓存匹配、分层压缩策略 - 新增3条举例说明:问天气(基础层足够)→ 多文件分析(主动启用)→ 发现AI低效(纠偏启用),用户能自行判断何时启用。 2. 文档质量-使用示例(4.5→目标4.9) - 新增「使用前后对比」专区,用同一个复杂任务的两次执行做对比: -- 执行方式——6轮对话,每轮带完整上下文,多次回退 vs 2轮完成,3个搜索并行发出 -- Token消耗——~5000+ vs ~1500(节省约70%) -- 输出质量——有"好的/希望有帮助"等冗余 vs 直接给结论,无前言结语 - 这个对比直接展示技能效果,弥补了之前"看完不知道怎么落地"的问题。 3. 方法库扩充 - 新增 KV Cache Prompt缓存 技术(references/guide.md): -- 分层缓存架构——5层结构:从最稳定的工具定义(1小时缓存)到最动态的当前消息(不缓存) -- 禁止行为——前缀插入时间戳、动态生成工具定义、非确定性序列化 -- 三平台使用方式——Anthropic(90%折扣,显式标记)/ OpenAI(50%折扣,全自动)/ Gemini(90%折扣+存储成本) -- 成本临界点——5分钟缓存仅需1.4次读取即可回本 - 该方法属于Agent端可控制的优化(通过Prompt结构调整),非底层框架改动,符合技能"全链条覆盖"定位。
    2026-06-11 06:40 安全 安全
  • v2.1.0 【针对评分反馈的改进】 1. 触发方式(4.0→目标4.9) - 新增「如何让技能生效」表格:基础层(自动生效)+ 主动层(需明确告知),用户按需选择 - 新增「验证是否生效的方法」:通过观察AI行为判断——复杂任务前是否有精简规划、回答是否直接无冗余 - FAQ新增Q2专门解答如何判断生效 2. 方法多样性 - 引入4种2025-2026年先进方法(通过搜索交叉比对后选取): -- Chain of Draft(草稿链) TokenOptimize 2026 推理Token减少92% 标准模型推理任务 -- 语义缓存(Semantic Caching) Redis/TokenOptimize 2026 成本最高减少73% 客服/FAQ等高重复场景 -- Intent Routing(意图路由) 腾讯云ADP 2026 简单查询Token减80%+ 请求量大、简单查询占比高 -- 分层模型策略 腾讯云ADP 2026 综合成本减76% 任务复杂度差异大 - 同时保留了原有已验证有效的方法(FOLD/UNFOLD、LightThinker++、SimpleMem等) 3. 全链条覆盖 - 重构为五引擎全链路结构:问题分流(新增)→ 输入压缩 → 记忆压缩 → 输出精简 → 推理优化 - 覆盖Agent使用过程中可被优化的所有环节:收到查询→判断→规划→调用工具→处理结果→输出响应 4. 输出质量优化 - 新增输出格式优化表格(JSON/YAML/TSV/TOON的Token对比),TOON比JSON省30-60% - 新增「压缩后输出膨胀」反模式——输入压缩过度可能导致模型用更长输出补偿 - 新增全Token消耗结构表(输入是输出3-10倍),帮助用户理解优化重点 5. 结构优化 - 单一文件拆分为SKILL.md + references/guide.md双文档结构 - SKILL.md控制在150行以内(之前单文件约300行),聚焦「怎么用」 - references按「输入/推理/输出/记忆/缓存/高级」分层展开,按需查阅
    2026-06-10 09:36 安全 安全
  • v2.0.0 更新说明:算力节省和记忆压缩 v2 【针对评分<4.0项的改进】 1. 可靠性-异常处理(3.3→提升) 旧版仅3条原则性描述("先读错误→修改重试→2次失败换方案"),新版补充: 三级错误处理流程:第1次失败→诊断重试(向用户说明原因)、第2次失败→换方案(附替代方案映射表)、第3次失败→交还用户(格式化输出已尝试方法和需要用户提供的输入) 替代方案映射表:search无结果→换关键词/换源/fetch直读;file_read编码错误→python3重读;API超时→缩小范围/分批请求 每步均向用户输出提示信息(⚠️/❌前缀),而非静默处理 2. 可靠性-运行稳定性(3.5→提升) 新增: 关键步骤验证点:执行完一步后检查结果是否符合预期,不符合立即修正 长任务分阶段执行:每阶段确认后进入下一阶段 上下文爆炸防护:工具输出超50K写入磁盘只给路径+2KB预览,一轮聚合不超200K 3次失败后交还用户,杜绝盲目重试导致的不可控行为 3. 规范性-反模式与FAQ(3.5→提升) 新增7条反模式,每条含错误做法/正确做法/判断标准: 对所有问题都走规划流程 想一步做一步 搬运原文 冗余前言结语 重复用户问题 用相同参数重试 在简单任务上过度压缩 新增6条FAQ:是否自动生效、能否手动开关、是否降低质量、记忆压缩是否丢信息、结构化vs自由CoT、高级技巧是否必学 4. 规范性-文档质量(3.8→提升) 新增4个完整使用示例,覆盖简单/中等/复杂/错误处理4类场景,每个示例含完整输入输出和消耗Token估算。让用户看完就知道怎么上手。 【针对评分=4.0项的改进】 5. 适用性-能力边界定义(4.0→提升) 新增能力边界与不适用场景专节,明确5类不适用/效果有限场景: 高精度任务(法律/医疗)→ 不压缩推理,保准确 创意/开放输出 → 放宽输出规则 首次学习型任务 → 先完整执行再优化 上下文极短对话 → 优化空间有限 需展示推理过程 → 推理压缩不适用 新增识别是否生效的方法:如仍出现"想一步做一步"、搬运原文、冗长前言结语,说明规则未有效执行。 6. 适用性-触发方式(4.0→提升) 新增FAQ说明:无法单独关闭但可临时放宽("这次不需要压缩");可手动加强执行力度("请严格按算力节省规则执行")。 7. 规范性-渐进式披露(4.3→提升) 记忆压缩章节拆分为三层渐进结构: 基础层(每轮必用):滑动窗口+重要性评分,含具体示例 进阶层(长对话启用):定期压缩+语义检索+SimpleMem,含示例 高级技巧(按场景选用):FOLD/UNFOLD、LightThinker++、动态上下文剪枝,以表格呈现,不展开细节 8. 有效性-开箱即用度(3.5→提升) 新增总览表(三环节+浪费来源+应对方法),一眼看清全貌 新增实测效果参考数据(单会话Token ↓76.7%,准确率↓0.8%) 新增4个完整使用示例(含Token消耗估算) 新增结构化CoT实测数据(自由CoT 187Token→结构化42Token,省77.5%) 新增推理状态缓存说明(语义相似度≥0.95命中缓存,Token降为0) 其他改进 执行自检清单从4项扩展为7项,新增"重复用户内容""盲目重试""不适用场景"3项检查 每条反模式附判断标准,便于自检时快速识别 错误处理每步均附用户提示模板(⚠️/❌前缀)
    2026-06-05 06:20 安全 安全
  • v1.0.1 基于v1.0.0的评分反馈和参考资料全面重写技能文件
    2026-06-04 06:46 安全 安全
  • v1.0.0 Initial release
    2026-06-03 07:00 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

反AI幻觉

user_8d4ddd46
反幻觉技能。对抗AI系统性"提供答案"倾向,确保输出诚实可靠。当回答涉及事实性信息、数据、引述、预测或专业领域知识时自动触发。核心原则:知之为知之,不知为不知。不适用于纯创作、翻译或格式转换等不涉及事实核查的场景。 建议和以下技能搭配使用:
★ 3 📥 63

麦肯锡金字塔原理与MECE方法论

user_8d4ddd46
麦肯锡金字塔原理与MECE方法论。基于明托《金字塔原理》和《实战篇》提炼。当用户要求分析、总结、梳理、归纳、分类、提炼信息,或需要结构化输出(报告、调研、要点整理)时自动触发。核心:结论先行、以上统下、归类分组(MECE)、逻辑递进。不适用
★ 2 📥 67

沃伦·巴菲特的思维模型和投资方法论

user_8d4ddd46
巴菲特思维模型与投资方法论。基于《致股东的信》《滚雪球》《跳着踢踏舞去上班》《奥马哈之雾》《巴菲特的投资组合》《终极金钱心智》等著作及2026年最新访谈提炼。当用户提到巴菲特、价值投资、安全边际、护城河、能力圈、内部记卡、长期持有、集中投资
★ 2 📥 60