阿里的Qwen3.5又有新动静了,在HuggingFace被曝光,代码提交都已经出现,估计发布应该也快了。
这次升级看点挺清晰的:用上了全新的混合注意力机制,还支持原生视觉理解,不只是文字处理,看图理解能力也会更原生、更流畅。
之前流出的信息也提到,逻辑推理、数学计算、写代码这些核心能力都有明显突破,继续走对标国际顶尖模型的路线。
更良心的是还会开源两个版本,2B密集小模型和35B-A3B的MoE大模型,不管是个人学习、开发者二次开发,还是企业落地都比较友好。
整体看下来,这是一次很扎实、很务实的迭代,没有太多虚头巴脑的概念,国产大模型一步步往上卷,还是挺值得期待正式上线后的真实表现的。#阿里新一代模型Qwen3.5曝光#
发布于 山东
