配置大模型给龙虾用折腾半天,用魔搭下载的千问27b是safetensor格式,特别难调用,还总是爆内存(那台有96GB),加了量化也没解决
最后发现直接用ollama去下载一个千问 7b就解决了,自带4bit量化,我全程只花了十分钟不到就可以调用而且速度贼快,这台还是64GB内存,显卡仅仅是gtx1080。。

配置大模型给龙虾用折腾半天,用魔搭下载的千问27b是safetensor格式,特别难调用,还总是爆内存(那台有96GB),加了量化也没解决
最后发现直接用ollama去下载一个千问 7b就解决了,自带4bit量化,我全程只花了十分钟不到就可以调用而且速度贼快,这台还是64GB内存,显卡仅仅是gtx1080。。

猜你喜欢
【6评论】【6点赞】
【1评论】【8点赞】
作者最新文章
热门分类
科技TOP
科技最新文章