①阿里巴巴開源全新一代大模型千問Qwen3.5-Plus,總參數(shù)為3970億,激活僅170億,性能超過萬億參數(shù)的Qwen3-Max模型。 ②千問3.5基于視覺和文本混合token上預(yù)訓(xùn)練,并新增中英文、多語言、STEM和推理等數(shù)據(jù)。
《科創(chuàng)板日?qǐng)?bào)》2月16日訊(記者 黃心怡)除夕當(dāng)天,阿里巴巴開源全新一代大模型千問Qwen3.5-Plus,總參數(shù)為3970億,激活僅170億,性能超過萬億參數(shù)的Qwen3-Max模型,部署顯存占用降低60%,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價(jià)格每百萬Token低至0.8元,為Gemini 3 Pro的1/18。
與前幾代的千問大語言模型不同,千問3.5從純文本模型升級(jí)為多模態(tài)模型。千問3預(yù)訓(xùn)練在純文本Tokens上進(jìn)行,而千問3.5基于視覺和文本混合token上預(yù)訓(xùn)練,并新增中英文、多語言、STEM和推理等數(shù)據(jù),以不到40%的參數(shù)量獲得超萬億的Qwen3-Max基座模型的性能。
千問3.5在MMLU-Pro知識(shí)推理評(píng)測(cè)中得分87.8分,超越GPT-5.2;在博士級(jí)難題GPQA測(cè)評(píng)中斬獲88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型紀(jì)錄;而在通用Agent評(píng)測(cè)BFCL-V4、搜索Agent評(píng)測(cè)Browsecomp等基準(zhǔn)中,千問3.5表現(xiàn)均超越Gemini 3 Pro、GPT-5.2。
在視頻理解方面,千問3.5支持2小時(shí)(1M token上下文)的視頻直接輸入,適用于長(zhǎng)視頻內(nèi)容分析與摘要生成。同時(shí),千問3.5實(shí)現(xiàn)了視覺理解與代碼能力的融合,結(jié)合圖搜和生圖工具,可將手繪界面草圖直接轉(zhuǎn)為可用的前端代碼。
值得注意的是,在Agent應(yīng)用方面,千問3.5可自主操作手機(jī)與電腦,在移動(dòng)端支持更多主流APP與指令,在PC端可處理多步驟操作,如跨應(yīng)用數(shù)據(jù)整理、自動(dòng)化流程執(zhí)行等。同時(shí),千問團(tuán)隊(duì)構(gòu)建了一個(gè)可擴(kuò)展的Agent異步強(qiáng)化學(xué)習(xí)框架,端到端可加速3到5倍,并將插件式智能體Agent支持?jǐn)U展至百萬級(jí)規(guī)模。
據(jù)悉,千問APP、PC端已第一時(shí)間接入Qwen3.5-Plus模型。阿里很快將繼續(xù)開源不同尺寸、不同功能的千問3.5系列模型。而性能更強(qiáng)的旗艦?zāi)P蚎wen3.5-Max不久也將發(fā)布。
今年春節(jié)期間,國(guó)產(chǎn)大模型領(lǐng)域迎來密集發(fā)布潮。字節(jié)跳動(dòng)的視頻生成模型Seedance 2.0、智譜AI旗艦?zāi)P虶LM-5、螞蟻集團(tuán)的全模態(tài)大模型 Ming-Flash-Omni 2.0、MiniMax 一代文本模型M2.5等相繼發(fā)布。此外,DeepSeek,網(wǎng)頁/APP正在測(cè)試新的長(zhǎng)文本模型結(jié)構(gòu),支持1M(百萬Token)上下文。
IDC中國(guó)研究經(jīng)理孫振亞認(rèn)為,大模型的能力正在從純粹的生成式輸出向智能體能力進(jìn)化。各家模型廠商都在代碼、多模態(tài)、長(zhǎng)上下文和工具調(diào)用能力上做針對(duì)性的優(yōu)化。“智能體落地毫無疑問是這一輪競(jìng)爭(zhēng)的重點(diǎn),甚至可以說是最核心的主線?!睂O振亞稱。

