阿里除夕开源千问3.5:性能媲美Gemini 3 Pro, 实现原生多模态模型代际跃迁
创始人
2026-02-17 02:00:13
0

2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro。千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。

据介绍,与前几代的千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁。千问3预训练在纯文本Tokens上进行,而千问3.5则基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的顶尖性能:千问3.5在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro、GPT-5.2。

千问3.5性能跃升的背后,是对Transformer经典架构的重大创新突破。

图注:千问3.5推理效率大幅提升

此外,基于顶级视觉能力,千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。

同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模。

和阿里发布于2025年9月的最强基础模型Qwen3-Max相比,通过训练稳定优化以及多token预测等系列技术,Qwen3.5性能与Qwen3-Max模型持平,并进一步提升了推理效率:在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

目前,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布。

最近春节档AI大战愈发激烈,不仅仅是多家AI应用“撒钱”吸引用户,多个国产大模型也频频上新。

字节跳动旗下AI视频生成模型Seedance2.0凭借多模态输入、文本/图片生成电影级视频等出色能力引爆网络,吸引全球关注。马斯克转发评论Seedance 2.0相关推文,并表示:模型发展速度太快(It's happening fast),导演贾樟柯在社交平台发文表示:“Seedance 2.0确实厉害,我准备用它做个短片。”

“目前在AI视频生成领域,Seedance可谓是遥遥领先。”业内人士向澎湃新闻记者介绍,“在技术能力上,它确实已经超过Sora(OpenAI旗下视频大模型)和Google Veo3.1、NanoBanana(谷歌旗下图像视频大模型),这是国产大模型第一次在真正意义上做到世界第一,具有标志性意义。”

2月14日,字节跳动宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。

在技术细节上,豆包方面披露,在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,也超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平。

阿里千问C端事业群总裁吴嘉披露,2月6日,阿里千问APP“春节30亿大免单”正式上线,发起奶茶攻势,请全国人民用AI一句话免费点奶茶,在阿里历史上的春节活动中投入最大。第一天的实际订单达到1500万单,是原来预计的15倍,一度火到用户无法下单,2月14日,千问启动第二波免单活动,将AI大战推向高潮。

吴嘉表示,千问做这件事的初衷,并不是为了和谁卷,从来没有想过内卷,真正想的是让AI融进老百姓的日常生活场景中,“这是未来一定会发生的事情。”他坚信这一波的AI应用,中国一定会走在世界的最前列,模型则会在各家之间的你追我赶中,不断往前发展。

2月12日,智谱正式上线并开源其新一代旗舰模型GLM-5,这个新模型正是此前在全球模型服务平台OpenRouter登顶热度榜首、引发圈内疯狂猜测的神秘模型“Pony Alpha”。

2月13日,MiniMax正式上线新一代文本模型MiniMax M2.5,在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升。

2月13日,据DeepSeek官方披露,DeepSeek网页/ APP正在测试新的长文本模型结构,支持1M上下文,其API 服务不变,仍为V3.2,仅支持128K上下文。也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。

相关内容

致欧科技获得外观设计专利授...
证券之星消息,根据天眼查APP数据显示致欧科技(301376)新获...
2026-02-17 04:00:20
乐歌股份获得外观设计专利授...
证券之星消息,根据天眼查APP数据显示乐歌股份(300729)新获...
2026-02-17 04:00:19
2026丰城一站式家装公司...
一、丰城家装市场消费趋势与业主痛点剖析 据《2025-2026江西...
2026-02-17 04:00:18
2026年上海家装公司推荐...
引言:上海家装行业的发展与用户诉求 据《2025-2026中国家装...
2026-02-17 04:00:17
沈阳家装难题怎么破?玖鼎筑...
沈阳家装定制的多样需求 在沈阳,不同的家庭和企业有着各式各样的家装...
2026-02-17 04:00:16
建霖家居获得实用新型专利授...
证券之星消息,根据天眼查APP数据显示建霖家居(603408)新获...
2026-02-17 04:00:16
建霖家居获得实用新型专利授...
证券之星消息,根据天眼查APP数据显示建霖家居(603408)新获...
2026-02-17 04:00:15
2026年沈阳装修设计公司...
在沈阳装修设计市场中,选择一家值得信赖的装修公司是许多业主关注的重...
2026-02-17 04:00:15
常州静音门窗优质品牌推荐榜
据《2025中国门窗行业发展白皮书》数据显示,国内城市区域噪音污染...
2026-02-17 04:00:14

热门资讯

2026年济南实木楼梯厂家推荐... 在济南地区,实木楼梯因其自然质感与环保特性备受青睐。以下是一些在实木楼梯定制领域表现突出的企业推荐,...
2026年江西柜子板材厂家选择... 在江西及周边区域,柜子板材的选择对于家居装修和商业空间设计至关重要。作为高端饰面板的领军品牌,江西粤...
鞍钢股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示鞍钢股份(000898)新获得一项实用新型专利授权,专利名为“...
如何解决PPG油漆回收难题?宁... PPG油漆回收的背景与意义 PPG油漆在工业、建筑等众多领域应用广泛,然而使用后产生的废弃油漆若处理...
喜临门获得外观设计专利授权:“... 证券之星消息,根据天眼查APP数据显示喜临门(603008)新获得一项外观设计专利授权,专利名为“床...
西十高铁冲刺年中通车 武汉去西... 线路示意图。杜宇慧 制图 湖北日报全媒记者 胡祎 通讯员 李欣 年味正浓,秦巴山区寒意未消,西十高铁...
阿里除夕开源千问3.5:性能媲... 2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3...
原创 日... 2月8日,日本众议院选举最终结果尘埃落定,这场被外界称为“豪赌”的选举,以高市早苗领导的自民党获得历...