財(cái)通證券(601108)發(fā)布研報(bào)稱,LPU為新一代面向大模型推理階段的芯片,核心為TSP架構(gòu)。該行認(rèn)為,LPU受益于低推理延時(shí)的優(yōu)異表現(xiàn),有望實(shí)現(xiàn)快速滲透,該行看好LPU的高成長性及LPU以機(jī)柜出貨時(shí)帶來的PCB機(jī)會,建議關(guān)注:智微智能(001339)(001339.SZ)(參股元川微)、星宸科技(301536)(301536.SZ)(多輪增資元川微)、滬電股份(002463)(002463.SZ)(英偉達(dá)(NVDA)PCB供應(yīng)商)、勝宏科技(300476)(300476.SZ)(英偉達(dá)(NVDA)PCB供應(yīng)商)、深南電路(002916)(002916.SZ)。
財(cái)通證券(601108)主要觀點(diǎn)如下:
LPU為新一代面向大模型推理階段的芯片,核心為TSP架構(gòu)
LPU是專為順序處理的計(jì)算密集型任務(wù)設(shè)計(jì)的新型芯片架構(gòu),核心在于TSP架構(gòu),包含五大功能模塊,將經(jīng)典的處理器五級流水線拆散在整個(gè)芯片內(nèi),進(jìn)而消除了硬件的復(fù)雜性,使指令執(zhí)行順序和時(shí)間具有確定性。在TSP架構(gòu)下,編譯器可以直接訪問并精確控制芯片的底層硬件狀態(tài),實(shí)現(xiàn)了軟件定義硬件。
LPU可縮短大模型推理過程中的延遲,提高用戶體驗(yàn)感
大模型在推理過程中會存在延遲,延遲與用戶體驗(yàn)感精密掛鉤,大模型推理過程中的延遲主要在Decode階段,核心瓶頸在于內(nèi)存帶寬。LPU具備更快的內(nèi)存帶寬,可縮短大模型推理過程中的延遲。同時(shí),基于LPU的大模型不僅具有更快的推理速度,還可以提供更具性價(jià)比的價(jià)格,可進(jìn)一步提高用戶體驗(yàn)感。
LPU具備廣闊的潛在發(fā)展空間,已步入量產(chǎn)初期
目前Tokens的消耗量大幅增長,2024年初我國日均Token的消耗量為1000億,2026年2月主流大模型合計(jì)日均Token消耗已到180萬億級別,Tokens消耗量快速增長,帶動推理芯片市場規(guī)模的高增長。LPU可降低大模型推理的延遲,該行認(rèn)為LPU有望在推理芯片市場中逐步滲透,具有高成長性的市場空間。目前LPU已步入量產(chǎn)初期,放量在即。
風(fēng)險(xiǎn)提示:AI技術(shù)迭代不及預(yù)期的風(fēng)險(xiǎn);大模型發(fā)展不及預(yù)期的風(fēng)險(xiǎn);LPU行業(yè)發(fā)展不及預(yù)期的風(fēng)險(xiǎn)。
