罗福莉谈MiMo降价背后，仍有2-3倍利润空间

智能机器之心 2026-05-28 15:38:39

罗福莉透露，在 API 价格对齐 DeepSeek 后，小米的高负载推理引擎仍能保持盈亏平衡。成本降低主要来自混合注意力架构与层次化 KV 缓存优化。针对缓存命中（Cache Hit）成本降低 99% 的设计目标，小米推理框架实现了针对滑动窗口注意力 SWA 的层次化 KV 缓存优化。生产测试显示，层次化优化将缓存的 token 容量提升至 5 倍，降低了 80% 的缓存成本。结合全局注意力模块之间的缓存读取重叠（Cache Read Overlap）技术，系统进一步压低了缓存命中的实际开销。成本削减 60%-80%，靠的是 1:7 的稀疏架构。70 层的模型，其实只有 10 层在全力通读长文本，另外 60 层在「滑动窗口」看局部。脑力用得少，服务器电费和算力费就省下来了。不敢想，没降价之前，模型厂商可以用“秒进斗金”来形容嘛....

0 阅读：0

智能机器之心

感谢大家的关注

作者最新文章

1

阶跃发布Step 3.7 Flash，多！快！好！省！

2

Sakana AI 新作：像拼积木一样训练大模型！

3

史上最强手写博士论文，没有之一！

4

逆天！彭博社曝光iOS 27 新 Siri，长这样…

5

李飞飞获布朗大学荣誉博士，同台皆是大佬！

6

英伟达老板黄仁勋，去清华当顾问了！

7

罗福莉谈MiMo降价背后，仍有2-3倍利润空间

8

数学大战，Mythos也攻克Erdős单位距离问题

9

《柳叶刀》警告：AI正在污染医学指南

10

CMU与UMD最新研究：大模型也需要“睡觉”!

科技TOP

1

库克也找马斯克合影，马斯克是不是白的喝多了有人说这俩都从美国来的，在中国合影干啥

2

成功了，俄罗斯光刻机终于研发出来了！俄罗斯ProgressSTP-350光刻机

3

大厂疯狂开源，不怕抄袭了？格局变大了？还是别天真了，商场没雷锋，全是阳谋……

4

魅族懵了！小米也懵了，第一个把副屏干成"奢侈品"的，居然是荣耀！磁吸副屏终于来

5

华为放大招！麒麟2026+韬定律，彻底跳出芯片卡脖子！刚从ISCAS2026现

6

为什么中文正在被AI“偷偷加价”？同样一句话，中文消耗的Token比英文更多

7

贾跃亭又拿到7000万美元投资贾跃亭又拿到了7000万美元的融资，目标是五年内在

8

80后真的见证了时代巨变用过算盘、计算器、DOS、win95、98、2000、X

9

兄弟们，摩托罗拉motorazr70Ultra正式发布，直接7499起

10

这个数据让人震惊，2025年Q4，在外卖领域，美团占了45%，淘宝居然占了45.

科技最新文章

1

天气越热，手机越烫手😭最近也太热了，体感直接上39度......整的iP

2

小米最可怕的，可能已经不是汽车了。很多人还在盯着SU7、YU7销量，结果这次财报

3

黄仁勋加入清华大学顾问委员会搜了下，这个委员会的现任主席是苹果CEO库克，其

4

vivo首款头戴降噪耳机配置还行，看怎么定价了，降噪最大深度58dB，重量

5

听我一句劝！现在就是荣耀500Pro的天下，性价比看它就行了荣耀

6

老黄加入了清华大学经济管理顾问委员会，该委员会的使命是加强学院与外部各界的联系，

7

DeepSeek崩了现在已经修复了，但崩的次数有点太频繁了，每个月都要来上这么一

8

折叠iPhone首批保护壳亮相了，看完图其实心里只有一个想法：既然这么复杂，还是

9

荣耀OS这波更新！锁屏直接封神了家人们。首款3D动态景深锁屏+通透到发光～

10

雷鸟GTMax售价2599元、雷鸟GT售价1899元。雷鸟GT