阿里除夕开源千问3.5:性能媲美Gemini 3 Pro, 实现原生多模态模型代际跃迁
创始人
2026-02-17 02:00:13
0

2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro。千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。

据介绍,与前几代的千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁。千问3预训练在纯文本Tokens上进行,而千问3.5则基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的顶尖性能:千问3.5在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro、GPT-5.2。

千问3.5性能跃升的背后,是对Transformer经典架构的重大创新突破。

图注:千问3.5推理效率大幅提升

此外,基于顶级视觉能力,千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。

同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模。

和阿里发布于2025年9月的最强基础模型Qwen3-Max相比,通过训练稳定优化以及多token预测等系列技术,Qwen3.5性能与Qwen3-Max模型持平,并进一步提升了推理效率:在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

目前,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布。

最近春节档AI大战愈发激烈,不仅仅是多家AI应用“撒钱”吸引用户,多个国产大模型也频频上新。

字节跳动旗下AI视频生成模型Seedance2.0凭借多模态输入、文本/图片生成电影级视频等出色能力引爆网络,吸引全球关注。马斯克转发评论Seedance 2.0相关推文,并表示:模型发展速度太快(It's happening fast),导演贾樟柯在社交平台发文表示:“Seedance 2.0确实厉害,我准备用它做个短片。”

“目前在AI视频生成领域,Seedance可谓是遥遥领先。”业内人士向澎湃新闻记者介绍,“在技术能力上,它确实已经超过Sora(OpenAI旗下视频大模型)和Google Veo3.1、NanoBanana(谷歌旗下图像视频大模型),这是国产大模型第一次在真正意义上做到世界第一,具有标志性意义。”

2月14日,字节跳动宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。

在技术细节上,豆包方面披露,在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,也超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平。

阿里千问C端事业群总裁吴嘉披露,2月6日,阿里千问APP“春节30亿大免单”正式上线,发起奶茶攻势,请全国人民用AI一句话免费点奶茶,在阿里历史上的春节活动中投入最大。第一天的实际订单达到1500万单,是原来预计的15倍,一度火到用户无法下单,2月14日,千问启动第二波免单活动,将AI大战推向高潮。

吴嘉表示,千问做这件事的初衷,并不是为了和谁卷,从来没有想过内卷,真正想的是让AI融进老百姓的日常生活场景中,“这是未来一定会发生的事情。”他坚信这一波的AI应用,中国一定会走在世界的最前列,模型则会在各家之间的你追我赶中,不断往前发展。

2月12日,智谱正式上线并开源其新一代旗舰模型GLM-5,这个新模型正是此前在全球模型服务平台OpenRouter登顶热度榜首、引发圈内疯狂猜测的神秘模型“Pony Alpha”。

2月13日,MiniMax正式上线新一代文本模型MiniMax M2.5,在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升。

2月13日,据DeepSeek官方披露,DeepSeek网页/ APP正在测试新的长文本模型结构,支持1M上下文,其API 服务不变,仍为V3.2,仅支持128K上下文。也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。

相关内容

大藤峡水利枢纽工程通过竣工...
钛媒体App 6月18日消息,从水利部了解到,大藤峡水利枢纽工程1...
2026-06-20 16:53:20
中达安中标:驷马涌、沙河涌...
证券之星消息,根据天眼查APP-财产线索数据整理,根据广州市白云区...
2026-06-20 16:52:57
中达安中标:【济南】唐冶片...
证券之星消息,根据天眼查APP-财产线索数据整理,根据济南和瑾置业...
2026-06-20 16:52:53
中达安中标:中山生命科学智...
证券之星消息,根据天眼查APP-财产线索数据整理,根据中山柏汇合成...
2026-06-20 16:52:50
去“第一施工队”还是“吃饭...
1 上海市第一施工队 同济大学,作为土木建筑界的“天花板”,同济学...
2026-06-20 16:52:17
如何选择适配不同工程场景的...
注浆工程常见应用场景及核心需求 当前国内基建领域持续发展,注浆类作...
2026-06-20 16:51:38
北京打孔桩施工队,钻孔灌注...
在建筑工程的地基处理领域,桩基础是确保上部结构稳定的关键。打孔桩与...
2026-06-20 16:50:38
净化工程优质施工队如何与其...
在净化工程领域,一支优质的施工队至关重要。四川福瑞莱净化设备有限公...
2026-06-20 16:49:49
天津打孔桩施工队,桩基基础...
在建筑结构中,桩基础是将上部荷载传递至深层稳定土层或岩层的一种常见...
2026-06-20 16:48:50

热门资讯

贵阳装修公司推荐:施工品质与用... 在贵阳装修,最怕遇到效果图“绣花枕头”、施工拖沓,甚至住进去后问题频发。今天,我们不谈虚的,直接盘点...
上海设计师品牌服装合作工厂 深挖设计师品牌落地痛点 上海戎若服饰成沪上设计圈靠谱合作伙伴 近些年本土原创设计力量崛起,越来越多新...
国誉府官方售楼处电话(国誉府)... 尊敬的购房者: 为提升服务效率并保障信息透明度,国誉府项目于 2026 年 6月11日正式启用官方统...
中煤科工北京华宇取得选煤厂多专... 国家知识产权局信息显示,中煤科工集团北京华宇工程有限公司取得一项名为“选煤厂多专业施工图委托提资方法...
甘肃印发2026年知识产权强省... 6月8日,记者从甘肃省市场监督管理局获悉,甘肃省知识产权强省建设工作联席会议办公室正式印发《2026...
陕西建工申请基于动态影像与视觉... 国家知识产权局信息显示,陕西建工第十三建设集团有限公司;陕西建工集团股份有限公司申请一项名为“一种基...
中国华冶申请门式脚手架防倾覆装... 国家知识产权局信息显示,中国华冶科工集团有限公司申请一项名为“一种门式脚手架防倾覆装置及使用方法”的...
厦门城健取得带有防坠结构的外脚... 国家知识产权局信息显示,厦门城健建设有限公司取得一项名为“一种带有防坠结构的外脚手架”的专利,授权公...
上海建工南桥混凝土取得防凝固混... 国家知识产权局信息显示,上海建工南桥混凝土有限公司取得一项名为“一种防凝固的混凝土储料斗振动卸料装置...
辽宁混凝土销售公司推荐:浩元混... 在辽宁,混凝土是支撑基建与房建的核心材料。面对区域内数十家搅拌站与供应商,工程采购方往往陷入选择困境...