財(cái)聯(lián)社2月22日電,據(jù)智譜官微消息,智譜推出了 GLM-5,這是一款旨在推動(dòng)編程范式從“Vibe Coding”(氛圍編程)轉(zhuǎn)向“Agentic Engineering”(智能體工程)的下一代基礎(chǔ)模型。GLM-5 在前代模型 GLM-4.5 的智能體、推理與編程(Agentic, Reasoning and Coding, ARC)能力基礎(chǔ)上,采用稀疏注意力(DeepSeek Sparse Attention,DSA)以大幅降低推理成本,同時(shí)保持長(zhǎng)上下文能力無損。
為了讓模型更好地與各類任務(wù)對(duì)齊,智譜構(gòu)建了一套新型異步強(qiáng)化學(xué)習(xí)(RL)基礎(chǔ)設(shè)施,通過將生成過程與訓(xùn)練過程解耦,從而大幅提升了后訓(xùn)練的迭代效率。此外,智譜還提出了全新的異步 Agent 強(qiáng)化學(xué)習(xí)算法,進(jìn)一步提升強(qiáng)化學(xué)習(xí)的效果,使模型能夠更有效地從復(fù)雜、長(zhǎng)程交互中學(xué)習(xí)。
智譜稱,基于上述創(chuàng)新,GLM-5 在主流的開放基準(zhǔn)測(cè)試中實(shí)現(xiàn)了 SOTA 性能。最關(guān)鍵的是,GLM-5 在真實(shí)世界編程任務(wù)中展現(xiàn)出前所未有的能力,在處理端到端軟件工程挑戰(zhàn)方面超越了此前所有開源基線。