HuggingFace的工程师ArthurZucker（transfo

蚁工厂 2026-05-12 12:38:34

Hugging Face 的工程师 Arthur Zucker （transformers 库的开发者）谈了他对AI替代机器学习工程师的看法：------------------这段会有点长，但我想给和我一样焦虑的机器学习工程师们一点信心。

我们经常看到很多宣传，说某个 AI 一次性完成了这个或那个任务，说模型变得多么强大，说我们甚至不需要 review PR，可以直接发到生产环境。

虽然在某些情况下这确实可能成立，但它远不能代表我们必须面对的全部挑战。

我 4 个月前开始使用 Claude Code，很快意识到它确实改变了我们的工作方式。我可以以 10 倍速度做实验，不写代码就修复小问题，也能轻松重构代码。

但是，这些任务“只是”繁琐，并不难。我日常工作中的挑战，是把研究代码集成到 transformers 里，并符合我们的标准。这很难，因为代码之美是抽象且主观的，有点像哲学。

由于我太依赖 Claude，也太相信它生成的代码看起来很不错，我在推进 deepseekv4 集成时，没有意识到 Claude 其实并没有真正理解这个模型。

我给了它 transformers 的访问权限、原始论文、原始代码、不同的博客文章、我过去的聊天记录、为添加模型而创建的 skills、一个 B200 节点，以及大量 token，但它并没有做好。它不理解 eager attention 路径，也不理解 causal attention 的基础。甚至在实现 manifold constrained hyper connections 时也是错的。

它确实帮我减轻了探索实现和调试的负担，但它没有帮我围绕模型本身进行推理。

我不是悲观主义者。我认为我们作为软件工程师的工作从未像现在这样好。我只是想说，我们仍然有工作要做；当某件事看起来好得不像真的时，我们仍然应该稍微谨慎一点。

0 阅读：0

感谢大家的关注

作者最新文章

1

HivisionIDPhotos: 一个轻量级的AI证件照制作算法。 githu

2

PhotoDemon，一个开源版的图像编辑器github.com/tannerh

3

skillshunt.io/这是个Claude Skills收集站。目前收录约6

4

github.com/wquguru/nof0最近很火的那个大模型投资排行榜项目

5

qwen团队押注线性注意力了，未来应该会主推Qwen3-Next这样的混合模型吧

6

创始人thomas wolf正在小🍠直播

7

老外都在抄中国物流黑科技作业10月24日，菜鸟新一代无人物流亮相。之前看过一些零

8

我的1024种生活程序员开放麦工作之外俺只能发发猫。不过看微博上好多技术大佬的

9

这个程序员节文案不错世界破破烂烂，程序员修修补补

10

学到一个字：鶸俺很鶸

热门分类

科技TOP

1

鸿蒙6.1的机型升级计划表，看看有没有你的机型，老机型几乎都是正式版，高端机型和

2

鸿蒙6.0系统又更新了，这次新增的功能还挺挺多的，主要是增加相机水印、以及图库的

3

大厂疯狂开源，不怕抄袭了？格局变大了？还是别天真了，商场没雷锋，全是阳谋……

4

我也越来越像个“旁观者”……用过功能机、翻盖机，也见过智能机怎么一步步把生活

5

折叠屏这些年一直被吐槽“能用但不好用”，所以到底是不好用还是做不好？这次华为

6

为什么中文正在被AI“偷偷加价”？同样一句话，中文消耗的Token比英文更多

7

主流大模型横向横评：DeepSeek最新一代到底强在哪？

8

一部地图，如何逼得苹果CEO公开承认错误

9

ColorOS16这个界面

10

一加Ace6至尊版165Hz京东方电竞屏，8600毫安时电池，120W快充。

科技最新文章

1

听我一句劝！荣耀各梯次的手机就参照这个“金字塔”，而好价可以瞄准近期的618，买

2

iPhone18Pro配色你喜欢哪一个？

3

万万没想到，荣耀这是下饺子式发新机啊！下半年几乎月月有新品，节奏拉满！目前已知

4

即将发布的大电池新机，荣耀直接霸屏！友商压力拉满⚡要说接下来的大电池手机市

5

荣耀5款闭眼入神机，全价位全覆盖🔥荣耀这5款手机，闭眼选不踩坑，从千元到

6

抖音竟然不是第一，就连第二也不是，中国APP软件月活跃榜，用户用的最多的还是微信

7

一文速览CPUGPUNPUTPU

8

还有一个双源供应的新闻。据知情人士透露，苹果和英特尔已经达成初步协议，英特尔将为

9

这次iPhone18Pro的“七大升级事件”，说实话挺对我这种老派科技迷胃口

10

看罢此图，深感老马目光之毒辣同行还在卷模型参数，他已洞悉天机，开始圈地建“算