狂砍82%英伟达GPU需求！阿里云新研究登顶会SOSP。网友：又一个DeepSe

嘴哥看科技 2025-10-23 12:41:11

狂砍82%英伟达GPU需求！阿里云新研究登顶会SOSP。网友：又一个DeepSeek时刻？

直接砍掉82%的英伟达GPU需求！阿里云CTO周靖人带队和北大合作，在计算机系统界顶会SOSP上公开了一个新技术--Aegaeon，能让一张GPU同时服务7个大模型。在运行参数量从1.8B到72B的47个大模型时，所需要的H20的数量从1192张锐减至213张，相当于省了一个亿！

众所周知，现在有各种各样的大模型，但是其中6%的热门模型要处理超过98%的请求。使用传统的方法，一张GPU只能跑两三个大模型，而且只能按顺序一个接一个地处理海量的请求，这就导致了GPU有的忙得卡死，有的闲得没事。

为了减少这种资源浪费，Aegaeon首次实现token级别调度：在模型A生成token后自动预测和规划，切到模型b生成token后再切换混合服务不同模型的不同请求，并且通过组件复用、显存精细化管理和KV缓存同步优化等技术，把模型切换的耗时从26.9秒压缩至0.8秒，效率提升了97%。有效吞吐量最多能提升9倍！

Aegaeon用更低的硬件成本实现了更高的性能。目前，这套系统已在阿里云百炼平台部署。这会是"另一个DeepSeek时刻"吗？你怎么看？

0 阅读：242

评论列表

pig3head

1

2025-10-23 20:51

用爱计算，孝子体验遥遥领先[赞]

嘴哥看科技

感谢大家的关注

作者最新文章

1

昇腾950炸场！国产算力的“朋友圈”，正在改写AI游戏规则谁也没想到，一场由昇腾

2

算力战争新战场：钱正在疯狂涌向上游材料！很多人还在盯着英伟达的GPU，但真正的钱

3

一边起诉一边用？马斯克翻车了法庭上被追问得没退路，马斯克终于说了句“Partly

4

美AI科技巨头映射国内核心全梳理，一图看懂！现在AI赛道那叫一个火，很多人知道A

5

看完这张全球四大光刻机厂商对比图，你可能会感到一种“清醒的震撼”。在全球光刻机版

6

很多人都想不通，为什么AI大模型只有中美两家在玩，德法日韩这些发达国家却“集体消

7

自从英伟达逐步失去中国市场后，华为已吃下中国AI芯片市场。华为今年AI芯片业务正

8

风向标已经开始转变，国产企业选择国产芯片进行适配，而且国内的很多大厂开始大量的采

9

伤害性不大，侮辱性极强！不但阿里没想到，腾讯想不到，百度更是万万没想到，作为后起

10

中国算力的真正王炸！首个“算电协同”正式投运，沙漠光伏直供AI！5月2日，宁夏中

热门分类

科技TOP

1

鸿蒙6.1的机型升级计划表，看看有没有你的机型，老机型几乎都是正式版，高端机型和

2

一图看懂OPPOFindX9sPro、OPPOFindX9Ultr

3

鸿蒙6.0系统又更新了，这次新增的功能还挺挺多的，主要是增加相机水印、以及图库的

4

我也越来越像个“旁观者”……用过功能机、翻盖机，也见过智能机怎么一步步把生活

5

折叠屏这些年一直被吐槽“能用但不好用”，所以到底是不好用还是做不好？这次华为

6

荣耀600Pro曝光：双2亿主摄+9000mAh电池，这配置绝了最近在网上看

7

主流大模型横向横评：DeepSeek最新一代到底强在哪？

8

一部地图，如何逼得苹果CEO公开承认错误

9

ColorOS16这个界面

10

DeepSeekV4震撼发布一图读懂它有多强：百万上下文、更强Agent、更

科技最新文章

1

苹果这下傻眼了吧[捂脸哭]荣耀600系列这是要贴脸开大的节奏[笑着哭]说实话，荣耀

2

今年iPhone17ProMax铝合金边框有多软？如图，摔了一下大概

3

听我一句劝！荣耀中高端手机选这四款就够了，少纠结不踩坑2000出头

4

正所谓得“道者多助，失道者寡助”，估计连网易音乐，QQ音乐，酷狗音乐自己也没想到

5

连高通都认证的折叠屏，荣耀MagicV6确实有点东西。刚看到高通官方给荣耀M

6

不装了！荣耀Magic9ProMax是要掀桌子的节奏，配置全面升级，“安卓机

7

【华为nova16Pro系列渲染图曝光！配四摄镜头模组】博主“定焦数码”

8

iPhone18Pro系列电池容量曝光这电池容量一点都不意外了我希望的是你换

9

不涨反降，高端旗舰玩出新逻辑！4月29日，华为Pura90系列全渠道开售，直接

10

AI算力的牌桌上，有人发现不对劲了。一头是嗷嗷待哺的大模型，对算力的渴求，正从8