①從曾經和文本大模型的“聊幾秒”到如今視頻大模型的“看幾秒”,算力消耗規(guī)模正在快速膨脹。 ②2025-2030年,分析師預計中國AI推理Token消耗量預計將增長約370倍。 ③Token需求“通脹”不僅利好云端算力,也讓模型廠商擁有了議價權。
《科創(chuàng)板日報》2月15日訊 2026年馬年春節(jié),互聯(lián)網大廠的“紅包戰(zhàn)”如期上演。百度撒下5億,騰訊元寶豪擲10億,阿里更是祭出30億免單的“鈔能力”。不過“撒錢”只是“開胃菜”,緊隨而來的則是參與者更多、頻率更密集的國產AI新品“春節(jié)檔”:
2月14日,字節(jié)跳動發(fā)布豆包大模型2.0系列,這是繼Seedance 2.0視頻模型和Seedream 5.0 Lite圖像模型之后打出的春節(jié)“第三彈”。智譜已在2月11日發(fā)布“系統(tǒng)架構師”級別的底座模型GLM-5;MiniMax緊隨其后,于2月12日上線并開源文本模型M2.5;連一向低調的DeepSeek,也在幾天前進行版本更新。在此之前,階躍星辰發(fā)布Step 3.5 Flash,阿里發(fā)布Qwen3-Coder-Next,且有望在春節(jié)期間發(fā)布Qwen 3.5。
每一次發(fā)布都是一次卡位,每一次迭代都是一次重塑行業(yè)格局的嘗試。這一波覆蓋文本、圖像、視頻多模態(tài)的AI“最強春節(jié)檔”已經拉開大幕。
▌多模態(tài)大模型接連面世 Token需求出現(xiàn)“通脹”
一年多前,字節(jié)內部曾判斷,AI對話類產品可能只是AI產品的“中間態(tài)”,長期更理想的產品形式,大概率需要更視覺化的用戶體驗、更低的用戶使用門檻。因此彼時的字節(jié)選擇提升即夢的產品優(yōu)先級,嘗試打造“AI時代的抖音”。
或許也正是因此,一年多以后,在字節(jié)的這次春節(jié)檔“三連彈”中,最先出場的不是最為大眾所熟悉的豆包,而是視頻模型Seedance 2.0。
而從曾經和文本大模型的“聊幾秒”到如今視頻大模型的“看幾秒”,算力消耗規(guī)模正在快速膨脹——從單條視頻來看,Seedance 2.0 生成一條10秒、1080p的視頻,大致要消耗35萬token。
Seedance 2.0的算力消耗增長并非孤例。春節(jié)檔的這輪密集發(fā)布,對各家廠商而言不僅是品牌宣傳的窗口期,也是一場對底層算力儲備的極限壓力測試。隨著越來越多的多模態(tài)和長文本大模型面世,勢必將進一步推高Token需求。
國聯(lián)民生證券指出,Token需求正在發(fā)生“通脹” 。這種“通脹”并非是指Token本身變貴,而是指單位時間內、單位用戶的Token消耗結構性上升。
數據顯示,火山引擎的大模型日均Token調用量已從2024年底的2萬億增長至2025年底的63萬億;阿里云外部客戶2025年日均Token調用也已接近5萬億,2026年目標至少15-20萬億,內部業(yè)務日均調用則計劃從16-17萬億拉到100萬億。從全行業(yè)看,中國整體日均Token消耗2024年初為1000億,2025年中突破30萬億,2026年2月主流大模型合計日均Token消耗已到180萬億級別。

摩根大通指出,春節(jié)AI應用推廣戰(zhàn)僅是表面,在這背后更深層的趨勢在于,消費者獲取信息和消費內容的方式正在經歷結構性變革,這一進程實際上推升了推理量,將驅動Token消耗量步入一個長達數年的高速增長期。
其預測,中國的AI推理Token消耗量預計將從2025年的約10千萬億增長至2030年的約3900千萬億,五年間增長約370倍。
▌Token成為“計量單位” 產業(yè)鏈開啟漲價
今年以來,全球云計算市場進入密集漲價周期。先是亞馬遜云宣布上調EC2機器學習容量塊價格約15%;之后谷歌云宣布北美、歐洲、亞洲地區(qū)全部漲價;國內廠商迅速跟進:優(yōu)刻得宣布全線產品與服務價格上浮。
隨后,智譜打響了年內大模型漲價“第一槍”。2月12日,其宣布GLM Coding Plan套餐價格體系結構性調整,取消首購優(yōu)惠,保留按季按年訂閱優(yōu)惠,套餐價格整體漲幅30%起。官方解釋是“市場需求持續(xù)強勁增長,用戶規(guī)模與調用量快速提升,為保障高負載下的穩(wěn)定性與服務質量,同步加大算力與模型優(yōu)化投入”。之后GLM Coding Plan上線即售罄。
國聯(lián)民生證券指出,智譜此前正因為用戶增長導致算力階段性緊張,對Coding Plan做過“限量發(fā)售”安排,這與其后續(xù)漲價形成了一個非常典型的“供需鏈條”:需求在短期內大幅增長→資源呈現(xiàn)剛性約束(導致限流/限量)→漲價。
在分析師看來,當行業(yè)依舊處在“模型價格戰(zhàn)”時,智譜給出的漲價信號,意味著大模型時代的“計量單位”從流量(DAU/時長)轉向Token(推理消耗),而Token消耗在越來越多場景里是剛需。綜合來看,Token需求“通脹”不僅利好云端算力,也讓模型廠商擁有了議價權;同時產業(yè)定價邏輯也發(fā)生改變,當推理消耗變成生產資料,模型廠商有機會把“算力稀缺”通過分層定價與訂閱化產品轉化為毛利與現(xiàn)金流。
落實到投資方向上,券商建議關注:
第一,云廠商與算力基礎設施:AI拉動的IT支出與基礎設施投入仍處上行周期,云側將受益于GPU算力、存儲與網絡I/O等“伴隨型消耗”的持續(xù)增長。
第二,大模型廠商:當它們能在編程、Agent、企業(yè)流程等高ROI場景中維持訂閱留存與企業(yè)席位擴張,能把“Token用量”穩(wěn)定轉成“省人省時省返工”的交付價值時,就具備了穿越開源與價格戰(zhàn)的能力。
第三,安全治理與運行時的防護工具:隨著企業(yè)把AI嵌入工作流,數據泄露、代理越權等風險將推動“AI安全平臺/治理平臺”成為剛需層。
