阿里除夕开源千问3.5:性能媲美Gemini 3 Pro, 实现原生多模态模型代际跃迁
创始人
2026-02-17 02:00:13
0

2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro。千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。

据介绍,与前几代的千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁。千问3预训练在纯文本Tokens上进行,而千问3.5则基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的顶尖性能:千问3.5在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro、GPT-5.2。

千问3.5性能跃升的背后,是对Transformer经典架构的重大创新突破。

图注:千问3.5推理效率大幅提升

此外,基于顶级视觉能力,千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。

同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模。

和阿里发布于2025年9月的最强基础模型Qwen3-Max相比,通过训练稳定优化以及多token预测等系列技术,Qwen3.5性能与Qwen3-Max模型持平,并进一步提升了推理效率:在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

目前,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布。

最近春节档AI大战愈发激烈,不仅仅是多家AI应用“撒钱”吸引用户,多个国产大模型也频频上新。

字节跳动旗下AI视频生成模型Seedance2.0凭借多模态输入、文本/图片生成电影级视频等出色能力引爆网络,吸引全球关注。马斯克转发评论Seedance 2.0相关推文,并表示:模型发展速度太快(It's happening fast),导演贾樟柯在社交平台发文表示:“Seedance 2.0确实厉害,我准备用它做个短片。”

“目前在AI视频生成领域,Seedance可谓是遥遥领先。”业内人士向澎湃新闻记者介绍,“在技术能力上,它确实已经超过Sora(OpenAI旗下视频大模型)和Google Veo3.1、NanoBanana(谷歌旗下图像视频大模型),这是国产大模型第一次在真正意义上做到世界第一,具有标志性意义。”

2月14日,字节跳动宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。

在技术细节上,豆包方面披露,在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,也超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平。

阿里千问C端事业群总裁吴嘉披露,2月6日,阿里千问APP“春节30亿大免单”正式上线,发起奶茶攻势,请全国人民用AI一句话免费点奶茶,在阿里历史上的春节活动中投入最大。第一天的实际订单达到1500万单,是原来预计的15倍,一度火到用户无法下单,2月14日,千问启动第二波免单活动,将AI大战推向高潮。

吴嘉表示,千问做这件事的初衷,并不是为了和谁卷,从来没有想过内卷,真正想的是让AI融进老百姓的日常生活场景中,“这是未来一定会发生的事情。”他坚信这一波的AI应用,中国一定会走在世界的最前列,模型则会在各家之间的你追我赶中,不断往前发展。

2月12日,智谱正式上线并开源其新一代旗舰模型GLM-5,这个新模型正是此前在全球模型服务平台OpenRouter登顶热度榜首、引发圈内疯狂猜测的神秘模型“Pony Alpha”。

2月13日,MiniMax正式上线新一代文本模型MiniMax M2.5,在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升。

2月13日,据DeepSeek官方披露,DeepSeek网页/ APP正在测试新的长文本模型结构,支持1M上下文,其API 服务不变,仍为V3.2,仅支持128K上下文。也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。

相关内容

原创 ...
时隔十年,国共领导人再次在北京会晤,郑丽文的一句重诺,让两岸人民放...
2026-04-18 12:32:15
小学生用电话手表报警,民警...
本文转自【湖州公安】; 四名小学生 在路上捡到705元现金 面...
2026-04-18 12:30:36
景宁畲族自治县咏彩兴邦胶粘...
胶粘石地坪地面路面包工包料包清工半包全包施工队 景宁畲族自治县,...
2026-04-18 12:29:15
国锐亚沙村售楼处官方-售楼...
三亚国锐亚沙村官方认证统一热线 官方售楼处电话:0898-6861...
2026-04-18 12:26:47
2026暖气片十大品牌,聚...
家装采暖季来临,暖气片的品牌选择直接关乎居住舒适度与使用年限。以下...
2026-04-18 12:25:32
溪口镇榻榻米哪家合适
在当下家居消费市场,榻榻米以其多功能性和独特的设计感,受到众多消费...
2026-04-18 12:24:14
深聊有实力的室内设计公司,...
近后台不少朋友给我留言,问起装修选室内设计公司的相关问题,一会问怎...
2026-04-18 12:21:09
擦玻璃机器人好用吗?202...
擦玻璃机器人好用吗?对于住高层、家里玻璃又多的朋友来说,手动擦窗不...
2026-04-18 12:19:40
杜亚智能窗帘重磅推出 re...
如今,智能家居已深度渗透到人们的日常生活中,人们对家居产品的智能化...
2026-04-18 12:18:26

热门资讯

景宁畲族自治县咏彩兴邦胶粘石地... 胶粘石地坪地面路面包工包料包清工半包全包施工队 景宁畲族自治县,浙南群山间的畲乡秘境,是全国唯一的...
国锐亚沙村售楼处官方-售楼处电... 三亚国锐亚沙村官方认证统一热线 官方售楼处电话:0898-68611777(本地直拨)(中介勿扰)(...
溪口镇榻榻米哪家合适 在当下家居消费市场,榻榻米以其多功能性和独特的设计感,受到众多消费者的青睐。尤其是在溪口镇,随着人们...
探寻有实力的床垫厂推荐,豪华床... 在国内床垫消费市场,从连锁酒店工程采购到家庭私人定制,不少从业者和消费者都会陷入这样的选购困境:行业...
如何选挂墙式浴室柜,有啥好方案 挂墙式浴室柜的优势 挂墙式浴室柜在现代家居装修中备受青睐。它不占用地面空间,使浴室看起来更加整洁、宽...
通州北运河放流3100公斤鱼苗... 4月9日上午,通州区北运河漕运码头岸边,一场特别的增殖放流活动正在进行。蓝色的放流滑道直通水面,一尾...
深聊私人会所软装选购,如何选择... 在如今追求高品质生活与个性化空间的时代,私人会所作为社交、休闲和商务活动的重要场所,其软装设计显得尤...
燃气改造施工,男子身着工装上门... “身穿工作服,进门前展示了一下方形工牌,随后简单进行自我介绍就奔着窗户去了……”去年12月甘井子区营...
厦门装修公司选择攻略:新手避坑... 一、厦门装修市场现状及需求 在厦门,拥有一套温馨舒适的家是许多人的梦想。随着装修需求的不断提升,业...
目前专业的半包装修公司 半包装修公司的行业现状 在武汉装修市场中,半包装修公司占据着重要的地位。行业报告显示,近年来半包装修...