【国联民生海外】❗️Qwen3.5已并入HFTransformers库,预计或

丹萱谈生活文化 2026-02-14 23:31:09

【国联民生海外】❗️Qwen3.5已并入HF Transformers库,预计或于春节后发布 [太阳]Hugging Face Transformers代码库显示,2月9日Qwen3.5模型已并入Transformers库新PR,表明阿里千问新一代基座模型Qwen3.5或发布在即。Qwen3.5预计将为原生可实现视觉理解的VLM类模型,此次发布或将开源至少2B的密集模型和35B-A3B的MoE模型。 [太阳]相比Qwen3 Next和Qwen3 VL MoE架构创新 模型或引入混合注意力机制(HybridAttention)和GatedDeltaNet机制:可同时处理FullAttention(Transformer自注意力机制)+LinearAttention,无论序列长度如何变化,缓存形状均保持恒定。此外,Qwen3.5或具备多模态能力,原生支持图像和视频理解。我们认为,该模型或有效平衡长序列效率与信息捕捉精度,兼顾纯文本优化与多模态适配。若该套架构顺利落地,其在长文本分析、多模态理解等场景中性能值得期待。 预计Qwen3.5推出在即&千问App在阿里体系内的打通式布局有望提速&叠加平头哥在芯片领域的前瞻布局,我们认为阿里巴巴是现有上市公司中为数不多的硬件+软件+生态全方位布局的公司。持续推荐【阿里巴巴】! 风险提示:AI模型技术发展不及预期;AI应用商业化进展不及预期;云计算需求不及预期

0 阅读:2
丹萱谈生活文化

丹萱谈生活文化

感谢大家的关注