①據(jù)DeepSeek官方公眾號消息,DeepSeek-V3.1正式發(fā)布。DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。 ②FP8對國產(chǎn)芯片的使用效率提升顯著,將進一步縮小與NV芯片的效率/成本差距,大大增加國產(chǎn)芯片的可用性。
據(jù)DeepSeek官方公眾號消息,DeepSeek-V3.1正式發(fā)布。DeepSeek在其官宣發(fā)布DeepSeek-V3.1的文章中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。DeepSeek官微在置頂留言里表示,UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設計。
FP8是Float8的簡稱,即用8位二進制數(shù)表示浮點數(shù),主要用于深度學習的訓練和推理。相比傳統(tǒng)的FP32(32位浮點數(shù))或FP16(16位浮點數(shù)),F(xiàn)P8顯著降低了顯存占用和計算資源需求,同時通過優(yōu)化設計(如動態(tài)范圍調(diào)整)維持了較高的精度。??FP8對國產(chǎn)芯片的使用效率提升顯著,將進一步縮小與NV芯片的效率/成本差距,大大增加國產(chǎn)芯片的可用性。
有機構指出,DeepSeek-V3.1 采用UE8M0 FP8 Scale,國產(chǎn)AI芯片-國產(chǎn)開源模型-下游應用,國產(chǎn)AI生態(tài)全方面閉環(huán)。當前國產(chǎn)AI芯片正處于技術突破與生態(tài)落地的關鍵窗口期,UE8M0 FP8助力國產(chǎn)芯片加速追趕。??
據(jù)財聯(lián)社主題庫顯示,相關上市公司中:
和而泰持有摩爾線程1.244%股份。摩爾線程是首個支持原生FP8的國產(chǎn)GPU廠商,基于全新MUSA Compute Capability 3.1計算架構,可提供原生FP8計算能力。
芯原股份用于高性能Transformer推理的NPU芯原VIP9000支持FP8技術,能讓客戶在云端完成FP8訓練后,直接快速部署到支持FP8的硬件中。
