摩爾線程發(fā)布“花港”GPU新架構(gòu),萬卡AI訓(xùn)練與推理能力,劍指英偉達(dá)

來源: 鳳凰網(wǎng)
利好

  鳳凰網(wǎng)科技訊12月20日,摩爾線程在北京首屆MUSA開發(fā)者大會(MDC2025)上公布了新一代全功能GPU架構(gòu)“花港”,并展示了其萬卡規(guī)模AI訓(xùn)練集群及多項(xiàng)技術(shù)進(jìn)展。

  此次發(fā)布的核心內(nèi)容涵蓋架構(gòu)升級、集群能力與推理性能等方面。新架構(gòu)“花港”支持從FP4到FP64的全精度計(jì)算,算力密度提升50%,能效實(shí)現(xiàn)10倍提升;谠摷軜(gòu),公司計(jì)劃推出專注于AI訓(xùn)練與推理的“華山”芯片,以及面向圖形渲染的“廬山”芯片。

  在訓(xùn)練集群方面,摩爾線程推出“夸娥”萬卡智算集群,稱其具備全精度通用計(jì)算能力,訓(xùn)練算力利用率在稠密模型上達(dá)到60%,在混合專家模型上達(dá)40%,訓(xùn)練線性擴(kuò)展效率為95%。在推理側(cè),公司與硅基流動合作,在DeepSeek R1671B模型上實(shí)現(xiàn)單卡Prefill吞吐量超過4000tokens/s,Decode吞吐量超過1000tokens/s。

  軟件生態(tài)方面,MUSA5.0版本對編程模型、計(jì)算庫和編譯器進(jìn)行了優(yōu)化,核心計(jì)算庫muDNN的GEMM與FlashAttention效率超過98%,通信效率達(dá)97%。公司還計(jì)劃逐步開源部分核心組件,包括計(jì)算加速庫與系統(tǒng)管理框架。

  在圖形領(lǐng)域,新架構(gòu)集成硬件光線追蹤加速引擎,并支持自研的AI生成式渲染技術(shù)。摩爾線程還展示了在具身智能、AI for Science等前沿領(lǐng)域的布局,推出仿真訓(xùn)練平臺MTLambda以及基于“長江”SoC的AI算力本MTT AIBOOK。

  此外,公司公布了面向下一代超大規(guī)模智算中心的MTTC256超節(jié)點(diǎn)架構(gòu)設(shè)計(jì),著眼于高密度硬件與能效優(yōu)化。

  此次大會,摩爾線程系統(tǒng)展示了從芯片架構(gòu)、集群基礎(chǔ)設(shè)施到端側(cè)設(shè)備的全棧技術(shù)布局,目標(biāo)是為國內(nèi)AI計(jì)算生態(tài)的發(fā)展提供硬件與軟件支持。因此行業(yè)人士普遍認(rèn)為,摩爾線程正全面對標(biāo)英偉達(dá),提前發(fā)布架構(gòu),以便提升軟件生態(tài)信心。

關(guān)注同花順財(cái)經(jīng)(ths518),獲取更多機(jī)會

0

+1
  • 北信源
  • 兆易創(chuàng)新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉視傳媒
  • 御銀股份
  • 中油資本
  • 代碼|股票名稱 最新 漲跌幅