将600亿参数大模型装进手机的瓶颈，终于被中国AI公司突破了。一个8

含含谈科技 2026-05-25 19:19:19

将 600 亿参数大模型装进手机的瓶颈，终于被中国 AI 公司突破了。一个8B参数的大模型通常需要16GB显存，但一家中国AI公司找到了一种方法，把模型压缩到不到3B，性能保留97%，省下6倍显存。如果结合MoE架构，8GB内存的普通手机，就能跑600亿参数的大模型。为什么这件事很重要？过去两年，端侧AI的瓶颈一直是"装不下"，手机内存太小，大模型太重。苹果、高通、联发科都在做芯片侧的优化，但压缩比的天花板一直卡在那里：要么性能损耗太大，要么压缩比不够看。这次的方案直接突破了这道卡口。背后的技术路径是量化压缩，把模型参数从浮点数降精度，极端情况下每个参数只用1个bit存储。全球有Meta、MIT等多个团队在追这条路，但能在国产算力上跑出完整方案，这是第一次。这个细节值得注意：不依赖英伟达GPU，用国产算力实现了相同效果。在当前芯片供应链压力之下，这不只是技术成果，更是一个独立可用的路径验证。反直觉的判断是：这件事的意义不在于"手机能跑大模型"，而在于"大模型不再需要数据中心"。当推理成本压到手机本地可以承担的程度，云端大模型的收费逻辑就会被重写谁先把模型装进终端，谁就掌握了下一轮AI应用的分发入口。

0 阅读：0

含含谈科技

感谢大家的关注

作者最新文章

1

iPhone Air 2 概念图

2

今天凌晨，MiMo-V2.5 系列永久降价，最高降幅达到99%，不再区分上下文窗

3

特斯拉高管称正研究三电机版Model 3 5月26日消息，随着特斯拉Model

4

三星 Galaxy S27 Pro 预计采用 Ultra 同款的超广角和主摄，仅

5

欧盟将对谷歌开近10亿欧元罚单据路透社报道，德国《商报》周一援引欧盟委员会知

6

大疆在日本摄像机市场占有72.5%市场份额 2026年4月，大疆在日本摄像机市

7

曝小米SU7欧洲路测，现身西班牙塞维利亚 5月25日，有外媒报道称，近日一辆小

8

DeepSeek 用蜜雪冰城的打法，攻城略地最近，DeepSeek 官方宣布

9

特斯拉的FSD改名了，价格依然是6.4万。原来叫：完全自动驾驶。现在改为：特

10

将 600 亿参数大模型装进手机的瓶颈，终于被中国 AI 公司突破了。一个8

科技TOP

1

库克也找马斯克合影，马斯克是不是白的喝多了有人说这俩都从美国来的，在中国合影干啥

2

成功了，俄罗斯光刻机终于研发出来了！俄罗斯ProgressSTP-350光刻机

3

大厂疯狂开源，不怕抄袭了？格局变大了？还是别天真了，商场没雷锋，全是阳谋……

4

魅族懵了！小米也懵了，第一个把副屏干成"奢侈品"的，居然是荣耀！磁吸副屏终于来

5

华为放大招！麒麟2026+韬定律，彻底跳出芯片卡脖子！刚从ISCAS2026现

6

为什么中文正在被AI“偷偷加价”？同样一句话，中文消耗的Token比英文更多

7

贾跃亭又拿到7000万美元投资贾跃亭又拿到了7000万美元的融资，目标是五年内在

8

80后真的见证了时代巨变用过算盘、计算器、DOS、win95、98、2000、X

9

兄弟们，摩托罗拉motorazr70Ultra正式发布，直接7499起

10

这个数据让人震惊，2025年Q4，在外卖领域，美团占了45%，淘宝居然占了45.

科技最新文章

1

天气越热，手机越烫手😭最近也太热了，体感直接上39度......整的iP

2

小米最可怕的，可能已经不是汽车了。很多人还在盯着SU7、YU7销量，结果这次财报

3

黄仁勋加入清华大学顾问委员会搜了下，这个委员会的现任主席是苹果CEO库克，其

4

vivo首款头戴降噪耳机配置还行，看怎么定价了，降噪最大深度58dB，重量

5

听我一句劝！现在就是荣耀500Pro的天下，性价比看它就行了荣耀

6

老黄加入了清华大学经济管理顾问委员会，该委员会的使命是加强学院与外部各界的联系，

7

DeepSeek崩了现在已经修复了，但崩的次数有点太频繁了，每个月都要来上这么一

8

折叠iPhone首批保护壳亮相了，看完图其实心里只有一个想法：既然这么复杂，还是

9

荣耀OS这波更新！锁屏直接封神了家人们。首款3D动态景深锁屏+通透到发光～

10

雷鸟GTMax售价2599元、雷鸟GT售价1899元。雷鸟GT