Qwen3.5 正式发布!开源多模态模型屠榜,全尺寸覆盖,本地部署+Telegram 全攻略!
就在刚刚,Qwen 正式发布了全新的开源模型系列 —— Qwen3.5 多模态模型。这一次更新,可以说在开源模型领域掀起了不小的震动。不仅性能几乎“屠榜”,而且全面迈向了原生多模态智能体时代,真正把开源模型带入了一个新的阶段。
![]()
Qwen3.5 多模态系列覆盖了从 0.8B 到 397B 的多个尺寸版本,适配不同硬件环境和应用场景。其中 0.8B 和 2B 两款模型体积极小,但推理速度极快,非常适合移动设备、物联网设备以及低延迟实时交互场景。在边缘端部署时,这类小模型可以实现更快响应和更低功耗,对于需要即时反馈的应用来说意义重大。
![]()
4B 版本则是“平民级”中的性能担当。它在资源消耗和性能之间取得了极佳平衡,非常适合作为轻量级 Agent 的核心大脑。对于本地部署用户或显存有限的开发者来说,这是一个兼顾智能水平与成本的理想选择。
9B 模型的表现则更进一步。它的综合能力可以媲美许多超大参数开源模型,在推理能力与多模态理解方面表现优异,同时对显存的要求却远低于百亿级以上模型,是服务器端部署中性价比极高的通用模型方案。
而最引人关注的,是开源的 Qwen3.5 397B-17B 模型。该模型总参数达到 3970 亿,但每次前向传播仅激活 170 亿参数,采用创新的混合架构,将线性注意力机制与稀疏混合专家(MoE)结构结合,在保持强大能力的同时显著优化了推理效率与成本。这种“高智能密度”的设计理念,让它在推理、编程、智能体能力、多模态理解等基准测试中全面领先。
![]()
Qwen3.5 还大幅扩展了多语言与方言支持,从 119 种提升至 201 种语言与变体,为全球开发者与企业用户提供更广泛的可用性和更完善的支持。模型发布后迅速引爆 AI 社区,连 Elon Musk 也在社交媒体上点赞评论,称其“智能密度令人印象深刻”。
![]()
![]()
真正让 Qwen3.5 脱颖而出的,是它的原生多模态与 Agent 能力。它不仅可以理解文本与图像,还能够边思考、边搜索、边调用工具,实现真正意义上的智能体协作。在代码与智能体方向,Qwen3.5 可以协助进行网页开发、游戏开发,尤其是在前端构建与界面适配方面表现出色。开发者只需输入自然语言指令,它便能生成可运行代码,并支持实时迭代。
基于 Qwen3.5 底座模型打造的 Qwen Code,更进一步提升了 Web-coding 体验。它能够将自然语言直接转化为代码,实现实时开发与创意生成任务,包括网页构建、项目原型设计,甚至视频生成等创新型任务,为日常编程与探索性开发带来流畅高效的体验。
![]()
在视觉智能体方向,Qwen3.5 可以自主操作手机或电脑完成任务。移动端已适配主流应用,支持自然语言驱动操作;电脑端则可处理跨应用数据整理与多步骤流程自动化,有效减少重复人工操作,显著提升效率。
![]()
视觉编程能力同样令人惊艳。Qwen3.5 可以将草图转化为结构清晰的前端代码,将简单游戏视频还原为逻辑框架,甚至将长视频内容提炼为结构化网页或可视化图表,大幅降低从创意到实现的门槛。
![]()
在空间智能理解方面,Qwen3.5 通过对图像像素与位置信息的建模,在物体计数、相对位置判断与空间关系描述任务中更加精准。它能够有效缓解因遮挡或视觉变化带来的误判,在自动驾驶场景理解与机器人导航等具身智能领域展现出良好潜力。
相比上一代视觉语言模型,Qwen3.5 在学科解题与复杂视觉推理任务上更加稳健。它能够结合图像内容与上下文进行多步逻辑推理,为教育与科研领域的多模态 Agent 应用提供更加可靠的基础能力。
![]()
![]()
如果你想在本地部署 Qwen3.5,可以通过 Ollama 来运行模型。Ollama 支持完全本地化部署与离线运行,保障数据安全,同时也能与自动化工具 OpenClaw 快速集成。不同尺寸模型对显存要求不同,例如部分版本约需 6GB 左右显存即可运行,而更大尺寸模型则需要更高显存配置。根据自身硬件条件选择合适版本即可。
通过 Ollama 下载模型后,可在终端运行对应命令进行加载。如果希望更友好地使用,也可以通过外部 UI 插件直接调用本地模型。在集成 OpenClaw 后,Qwen3.5 可以实现网页搜索、信息收集、结构化报告生成,以及自动化编程任务。
安装部署教程
1、下载Ollama 最新官方客户端:【点击下载】
![]()
2、下载 Qwen3.5 最新模型
安装好Ollama客户端以后,现在我们需要下载对应的 Qwen3.5 模型,根据自己的需要和硬件配置来选择合适的模型大小
【点击前往】
或者可以直接使用模型下载命令来完成:
ollama run qwen3.5:9b ollama run qwen3.5:35b
安装号模型以后,如果想直接通过可视化的UI操作界面,来先使用的话,那么可以使用下方的这个浏览器来实现,它是完全免费的。
浏览器插件:【点击下载】
![]()
3、安装部署 OpenClaw
下载好模型以后通过下面的命令来安装最新的OpenClaw客户端:
ollama launch openclaw
4、对接 Telegarm 电报机器人
如果需要接入 Telegram,只需在 OpenClaw 中重新进入配置流程,选择本地 Ollama 模型,创建 Telegram Bot 并填写 Bot Token,通过配对命令完成绑定即可。完成后,你就可以在 Telegram 中直接调用本地 Qwen3.5 模型进行对话、写代码或执行自动化任务,全程本地运行,无需额外 API 费用。
打开你的 Telegram,搜索 @BotFather,发送 /newbot,来创建一个新的机器人,按提示设置:
给 Bot 起个名字,比如我设置为 lingduopenclaw
设置用户名(必须以 bot 结尾,比如 lingduopenclawbot )
最后会给你一串 Token:
8123121125:AAExamegv-0FQCfhfbazmp4405V0XAJCKfk
![]()
输入 token 进行对接,并进入到刚才创建的机器人里,第一次打开会显示还未正式对接,但是会在里面提供配对码,比如我的是 Pairing code: DLW7HQ69
![]()
现在只需重新打开一个新的 Powershell 窗口,然后在里面输入配对命令即可
openclaw pairing approve telegram 这里填写你的配对码
当你看到这个界面的话说明已经和Telegram配对成功了!
![]()
5、重启后启动的命令:
6、彻底卸载并删除OpenClaw
总的来说,Qwen3.5 的发布不仅刷新了开源模型的性能上限,也让原生多模态智能体真正走向普及。从移动端到服务器,从轻量部署到超大规模模型,从视觉理解到自动化编程,它正在构建一个更完整、更高效的开源 AI 生态。
