2026年了,GPT瞎编参考文献的问题解决的怎么样了?网页链接这篇文章做了实验,

蚁工厂 2026-05-12 19:44:30

2026年了,GPT瞎编参考文献的问题解决的怎么样了?网页链接这篇文章做了实验,结果是比过去好很多了。当然还不能保证完全没问题。结果如图。右下绿色区域最好。“我们考虑两个维度:深度看引用文献数,可靠性看错误的引用文献数量。

• 右下绿色理想区:Claude 和 DeepSeek 在这个区域,覆盖的文献既多,同时几乎没有引用错误。• 左下浅蓝保守区:GPT 单独一家,引用错误为零,但篇幅只有第一档的一半。• 右上浅红危险区:GLM 和 Kimi 生成的文献综述字多,但错得也多。

两档之间有一道明显的台阶。 第一档是 Claude 和 DeepSeek,既深又准;第二档是另外三家,要么浅,要么不准。”

AI创造营

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注