我现在用qwen3.6 27b Q8 上下文256k KV不做量化的全资源模式做guda.cn项目的code review。这个项目代码量庞大,工程目录已经达到1.48G。
任务启动以后内存和显存各占45G,随着任务量的增加,会有略微的上涨。你买了一个48G的显卡是能进行生产力干活的,需要一点牺牲,压缩一下KV,但32G的就费劲了。
这就是我为什么没买5090的原因,32G还是憋屈,各种难受,甩不开膀子。上48G的只能满足当下的使用,一点余量没有,这对投资来说也是危险的,不如一把梭到rtxpro6000,没有比它再好的生产力产品了,再往上就是数据中心集群训练卡了。
