很多人问我MiniMax价格的事儿，我说两句｜MiniMax今天发了M3

很多人问我MiniMax价格的事儿，我说两句｜ MiniMax 今天发了 M3，你刷到了吧。我直接说重点：这是国产模型里，第一个同时集齐三样的开源模型：编程能力达到最顶尖那一档、100 万上下文窗口、以及原生多模态。在这之前，能把这三样同时做到的只有 Opus 4.8、Gemini 3.1 和 GPT 5.5，它们全都是闭源的，实测下来的感受是，它超过了 Sonnet 4.6。 Sonnet 4.6 是现在全球开发者用得比较多的模型之一，写代码、跑 Agent、处理文档，大部分人吃的就是这碗饭，M3已经到了能上生产环境的水平。 100 万上下文窗口意味着什么？一次性吃下一整个项目的代码库，连带文档、测试用例、历史记录一起读进去，边读边改。我研究了下背后的技术： MiniMax自研了一个叫MSA的稀疏注意力架构，100 万 token 上下文的计算量只有上一代模型的二十分之一，推理时，模型理解问题的阶段快了 9 倍，生成答案的阶段快了 15 倍。说白了，100 万上下文以前谁都能做，就是算不起这笔账，MSA 把成本打下来了。看了几个例子：一个是让 M3 去优化 CUDA 算子，24 小时跑了 147 次提交，把性能从 cuBLAS 基准的 7.6% 拉到了 71.3%，全程自主迭代。另一个是拿一篇 ICLR 获奖论文扔给它，12 小时独立复现，跑通训练流程出结果；这些场景是真正的工程活，能干这种活的模型，全球数得过来。 MiniMax还同步发了 MiniMax Code，一个编程 Agent 工具，对标 Claude Code 和 Codex。这个工具跟 M3 一起训练出来的，模型加工具一起上，卖一套完整的开发者工作流。另外，M3 是即将开源的。对很多中大型公司来说，这是排在能力前面的硬门槛；能力到了，价格低了，还开源，三样凑齐，企业才真的会从闭源切过来。再来说价格。我算了笔账。 MiniMax 这次同步更新了 Token Plan，分三档。每个月 49 块，给 6 亿 token；对比一下，Claude Pro一个月 145 块，量只有 MiniMax五分之一。每个月119块，给18亿 token；Claude Max 5x 一个月 730 块，量只有 MiniMax 的一半，价格贵了 6 倍。每个月469块，给 55 亿 token；对标 Claude Max 20x套餐，量还多出 3 倍。同价位拉平算，MiniMax 给的量大概是 Claude 的 15 倍。别人把前沿能力当高端品卖，MiniMax选择把门槛降到最低，让更多开发者用上。我认为，模型层战争不会停，各家还会继续卷能力。MiniMax M3 押的是另一个逻辑：用顶级能力配上普惠定价，先把开发者生态用起来。

0 阅读：5

很多人问我MiniMax价格的事儿，我说两句｜MiniMax今天发了M3

MiniMax这次终于发布了他们的大版本号模型升级MiniMaxM3。主要

使用token数狂多的Agent是个大泡沫！发现不对劲的公司，越来越多了很多人都

上周，OpenClaw创始人贴出了自己的Token使用量。（下图）他一

何庭波女士可能怎么也没想到！她信心满满地发布了震惊全球的"韬（τ）定律"

学AI模型最麻烦的的，往往是两极分化的教程：要么浅得只教你调API，要么深

逛这个月GitHub上升星最快得项目绝对就是Understand-Any

谁能想到，梁文锋这回是真把桌子给掀了。他带着团队闷头干了五个月，把DeepSee

Claude被曝"抄"中国AI，这反转我没想到今天AI圈炸了——Anthrop