財聯(lián)社9月16日電,在9月16日舉行的2025騰訊全球數(shù)字生態(tài)大會上,騰訊集團副總裁、騰訊云總裁邱躍鵬透露,目前,騰訊云已在推理加速、Agent Infra和國際化布局等方面取得突破,騰訊云正不斷升級云基礎(chǔ)設(shè)施,以支撐Agent規(guī)?;涞睾推髽I(yè)全球化發(fā)展。邱躍鵬介紹,在推理加速方面,騰訊云深入?yún)⑴c開源貢獻,向DeepSeek、vLLM、SGLang等社區(qū)提交了多項優(yōu)化技術(shù)。針對大模型推理面臨的內(nèi)存瓶頸,騰訊云自研并開源FlexKV多級緩存技術(shù),大幅降低KVCache的占用,將首字時延降低多達70%。