看到针对通用AI大模型的一个有趣测试。问题是:我准备洗车,我家到洗车店距离100米,我是走过去还是开车去?分别测试DeepSeek、千问、豆包、Kimi和元宝,结果它们给出的答案大相径庭。总结:千问回答最靠谱,而且还能给出周边洗车店推荐以及最后一点小情绪价值DeepSeek也发现了问题中的逻辑陷阱,给出了正确答案元宝回答面面俱到,但给人一种画蛇添足的感觉豆包和Kimi则是直接沦陷,推荐健康环保的步行方案。科技先锋官





看到针对通用AI大模型的一个有趣测试。问题是:我准备洗车,我家到洗车店距离100米,我是走过去还是开车去?分别测试DeepSeek、千问、豆包、Kimi和元宝,结果它们给出的答案大相径庭。总结:千问回答最靠谱,而且还能给出周边洗车店推荐以及最后一点小情绪价值DeepSeek也发现了问题中的逻辑陷阱,给出了正确答案元宝回答面面俱到,但给人一种画蛇添足的感觉豆包和Kimi则是直接沦陷,推荐健康环保的步行方案。科技先锋官





作者最新文章
热门分类
科技TOP
科技最新文章