2026年了，GPT瞎编参考文献的问题解决的怎么样了？网页链接这篇文章做了实验，

蚁工厂 2026-05-12 19:44:30

2026年了，GPT瞎编参考文献的问题解决的怎么样了？网页链接这篇文章做了实验，结果是比过去好很多了。当然还不能保证完全没问题。结果如图。右下绿色区域最好。“我们考虑两个维度：深度看引用文献数，可靠性看错误的引用文献数量。

• 右下绿色理想区：Claude 和 DeepSeek 在这个区域，覆盖的文献既多，同时几乎没有引用错误。• 左下浅蓝保守区：GPT 单独一家，引用错误为零，但篇幅只有第一档的一半。• 右上浅红危险区：GLM 和 Kimi 生成的文献综述字多，但错得也多。

两档之间有一道明显的台阶。第一档是 Claude 和 DeepSeek，既深又准；第二档是另外三家，要么浅，要么不准。”

AI创造营

0 阅读：0

感谢大家的关注

作者最新文章

1

HivisionIDPhotos: 一个轻量级的AI证件照制作算法。 githu

2

PhotoDemon，一个开源版的图像编辑器github.com/tannerh

3

skillshunt.io/这是个Claude Skills收集站。目前收录约6

4

github.com/wquguru/nof0最近很火的那个大模型投资排行榜项目

5

qwen团队押注线性注意力了，未来应该会主推Qwen3-Next这样的混合模型吧

6

创始人thomas wolf正在小🍠直播

7

老外都在抄中国物流黑科技作业10月24日，菜鸟新一代无人物流亮相。之前看过一些零

8

我的1024种生活程序员开放麦工作之外俺只能发发猫。不过看微博上好多技术大佬的

9

这个程序员节文案不错世界破破烂烂，程序员修修补补

10

学到一个字：鶸俺很鶸

热门分类

科技TOP

1

鸿蒙6.1的机型升级计划表，看看有没有你的机型，老机型几乎都是正式版，高端机型和

2

鸿蒙6.0系统又更新了，这次新增的功能还挺挺多的，主要是增加相机水印、以及图库的

3

大厂疯狂开源，不怕抄袭了？格局变大了？还是别天真了，商场没雷锋，全是阳谋……

4

我也越来越像个“旁观者”……用过功能机、翻盖机，也见过智能机怎么一步步把生活

5

折叠屏这些年一直被吐槽“能用但不好用”，所以到底是不好用还是做不好？这次华为

6

为什么中文正在被AI“偷偷加价”？同样一句话，中文消耗的Token比英文更多

7

主流大模型横向横评：DeepSeek最新一代到底强在哪？

8

一部地图，如何逼得苹果CEO公开承认错误

9

ColorOS16这个界面

10

一加Ace6至尊版165Hz京东方电竞屏，8600毫安时电池，120W快充。

科技最新文章

1

听我一句劝！荣耀各梯次的手机就参照这个“金字塔”，而好价可以瞄准近期的618，买

2

iPhone18Pro配色你喜欢哪一个？

3

万万没想到，荣耀这是下饺子式发新机啊！下半年几乎月月有新品，节奏拉满！目前已知

4

即将发布的大电池新机，荣耀直接霸屏！友商压力拉满⚡要说接下来的大电池手机市

5

荣耀5款闭眼入神机，全价位全覆盖🔥荣耀这5款手机，闭眼选不踩坑，从千元到

6

抖音竟然不是第一，就连第二也不是，中国APP软件月活跃榜，用户用的最多的还是微信

7

一文速览CPUGPUNPUTPU

8

还有一个双源供应的新闻。据知情人士透露，苹果和英特尔已经达成初步协议，英特尔将为

9

这次iPhone18Pro的“七大升级事件”，说实话挺对我这种老派科技迷胃口

10

看罢此图，深感老马目光之毒辣同行还在卷模型参数，他已洞悉天机，开始圈地建“算