今天都在刷这个问题:「想去洗车,离洗车店只有五十米,我应该走路去还是开车去?」看

云锂的车啊 2026-02-11 17:58:43

今天都在刷这个问题:「想去洗车,离洗车店只有五十米,我应该走路去还是开车去?」看大家发上来的结果全都是回答错误的,这其实有点春秋笔法的意味

大家可以试试主流的大模型产品,改下模型类型,你会发现:回答错误的一般是快速思考模型,而正常的逻辑推理、深度思考模型一般都不会掉陷进(我随便用了个千问,模型区别可以看左上)

快速思考的方法是特征的单步映射,即「输入→特征匹配→输出」,一般都是很简单的架构。这种思考没有因果链,没有反证环节,只做表面映射,有错误是很正常的。

深度思考一般会有CoT(逻辑链)+因果校验,动作上会做前提校验,从而能够拆解隐藏目标,同时还会有「状态记忆」相关模块,能够记录每一步推理的中间结论和校验结果。

简而言之,其实就是能否提取出「洗车」这个「core_goal」。

当然,快速思考模型有没有算法上优化的空间,例如不借助LLM和CoT,用浅层网络或者简单的DNN架构,去做分步拆解,来提高准确率?这些都是后话了。

但用快速思考模型的错误回答(某种程度上来讲就是明知bug→利用Bug→印证bug)然后用这个结果来否定整个模型市场,是不是有点那啥了...行业观察

0 阅读:0
云锂的车啊

云锂的车啊

感谢大家的关注