隨著Anthropic重磅推出的Claude Cowork,以及OpenClaw這類可自主執(zhí)行任務(wù)的超級AI代理工具在2026年集中爆發(fā),ai智能體(886099)浪潮可謂迅速席卷全球,AI算力架構(gòu)瓶頸正在從以矩陣乘加吞吐為核心的GPU,徹底轉(zhuǎn)向以控制流、任務(wù)編排、內(nèi)存/IO協(xié)調(diào)為核心的數(shù)據(jù)中心CPU,面向超大規(guī)模AI數(shù)據(jù)中心的高性能CPU陷入嚴(yán)峻供不應(yīng)求態(tài)勢。
ai智能體(886099)風(fēng)靡全球之際,AI算力投資主線正在從“圍繞GPU的單點算力競賽”轉(zhuǎn)向“ai智能體(886099)驅(qū)動的全棧算力系統(tǒng)”,下一輪超額阿爾法收益將不再只屬于AI GPU/AI ASIC領(lǐng)域最強(qiáng)龍頭名單,而會系統(tǒng)性擴(kuò)散到CPU、存儲、PCB、液冷系統(tǒng)、ABF載板與廣泛晶圓代工等全棧AI算力基礎(chǔ)設(shè)施層,而在這種AI主線敘事轉(zhuǎn)變中,CPU、光互連與存儲芯片(886042)可能是最大贏家勢力。
正是在CPU需求大爆發(fā)背景之下,兩大x86架構(gòu)CPU超級巨頭——英特爾(INTC)(INTC.US)與AMD(AMD.US)股價近期攜手狂飆且不斷創(chuàng)下歷史新高點位。與此同時,重返數(shù)據(jù)中心CPU市場的高通(QCOM)(QCOM.US)近10個交易日股價瘋漲60%,凸顯出投資者們對于AI算力“關(guān)鍵瓶頸”持續(xù)升溫看漲情緒。知名投資研究機(jī)構(gòu)GF Securities近日發(fā)布研究報告稱,“數(shù)據(jù)中心服務(wù)器CPU正在上演超級周期(883436)”,AMD(AMD.US)、英特爾(INTC)(INTC.US)以及高通(QCOM)(QCOM.US)可能成為主要受益者。
中東戰(zhàn)火壓不住“AI牛市”敘事! GPU不再一枝獨秀 智能體大趨勢引爆CPU
在中東戰(zhàn)火背景之下,經(jīng)歷最新一輪的全球股票市場從階段性低點到創(chuàng)新高的投資者們最深刻心得無疑在于——不要把每一條地緣政治頭條都當(dāng)成趨勢本身,過去數(shù)周的市場已經(jīng)將“特朗普臨陣退縮”、“AI算力基礎(chǔ)設(shè)施鏈條驅(qū)動的科技板塊業(yè)績大幅上修趨勢”以及“美伊與以色列最終會回到談判桌”這些核心邏輯位列地緣政治等級之上。
過去兩年AI敘事幾乎被GPU壟斷,CPU一度像是AI軍備競賽里的“配角”;但隨著開源的OpenClaw這類型代理式AI工作流(即ai智能體(886099))主導(dǎo)的推理工作負(fù)載、數(shù)據(jù)編排、任務(wù)調(diào)度、內(nèi)存訪問、網(wǎng)絡(luò)通信和多工具調(diào)用全面增長,市場可謂徹底意識到:沒有強(qiáng)大的CPU作為系統(tǒng)中樞,GPU集群無法高效運轉(zhuǎn)。這本質(zhì)上就是CPU從“被低估的基礎(chǔ)設(shè)施”重新回到芯片舞臺最中央,帶有非常明顯的“文藝復(fù)興”式復(fù)古浪潮意味。
在智能體鏈路中,大量工作負(fù)載不僅耗費在GPU上的token生成,還消耗在Python解釋執(zhí)行、網(wǎng)頁抓取、數(shù)據(jù)庫檢索、RAG索引訪問、詞法處理、任務(wù)隊列調(diào)度、rpc(RPC)/IPC通信、KV狀態(tài)更新等CPU主導(dǎo)環(huán)節(jié),這意味著決定用戶體驗的,越來越不是單顆GPU的峰值算力,而是CPU是否有足夠的核心數(shù)、線程并發(fā)、緩存層級、內(nèi)存帶寬、PCIe/CXL/互連調(diào)度能力去支撐高頻工具調(diào)用與高密度任務(wù)切換。一旦CPU核心、內(nèi)存子系統(tǒng)或I/O調(diào)度不足,GPU即便名義算力充裕,也會因數(shù)據(jù)準(zhǔn)備、任務(wù)協(xié)調(diào)和系統(tǒng)等待而出現(xiàn)利用率塌陷。
因此,毋庸置疑的是,AI算力架構(gòu)的瓶頸正在從以矩陣乘加吞吐為核心的GPU,徹底轉(zhuǎn)向以控制流、任務(wù)編排、內(nèi)存/IO協(xié)調(diào)為核心的數(shù)據(jù)中心CPU,這一變化的根源在于工作負(fù)載范式已經(jīng)發(fā)生了本質(zhì)遷移。CPU不再只是通用計算芯片,而是智能體時代的控制平面處理器、系統(tǒng)編排引擎與資源調(diào)度中樞,“被低估的CPU成為AI新瓶頸”并非情緒化判斷,而是AI工作負(fù)載從“推理計算問題”進(jìn)一步升級為“復(fù)雜系統(tǒng)工程問題”后的必然結(jié)果。
早期大模型推理以“單次請求—單次生成”為主,CPU更多承擔(dān)數(shù)據(jù)搬運、請求路由與基礎(chǔ)調(diào)度,屬于典型的輔助控制面;但進(jìn)入ai智能體(886099)與強(qiáng)化學(xué)習(xí)時代后,系統(tǒng)負(fù)載不再是單一前向推理,而是演變?yōu)榘蝿?wù)規(guī)劃、工具調(diào)用、子代理協(xié)同、環(huán)境交互、狀態(tài)管理與結(jié)果驗證在內(nèi)的復(fù)雜閉環(huán)。上述“編排層”(orchestration layer)本質(zhì)上是強(qiáng)控制流、強(qiáng)分支判斷、強(qiáng)系統(tǒng)調(diào)用、強(qiáng)內(nèi)存訪問的CPU密集型任務(wù),無法被GPU高效替代,因此CPU正從過去的“配角”變成決定系統(tǒng)吞吐、時延與資源利用率的新瓶頸。
摩根士丹利(MS)最新預(yù)測數(shù)據(jù)顯示,智能體大爆發(fā)標(biāo)志著從計算到編排的結(jié)構(gòu)性轉(zhuǎn)變,由此推導(dǎo)出到2030年新增325億美元至600億美元的CPU增量市場空間,并將服務(wù)器級別CPU總TAM大幅擴(kuò)至825億至1100億美元量級。TrendForce的一項預(yù)測報告則顯示,在ai智能體(886099)時代,CPU:GPU配比可能會從傳統(tǒng)AI數(shù)據(jù)中心的1:4至1:8,向1:1至1:2大幅重估。
AI推理大浪潮推動服務(wù)器CPU需求爆發(fā),五年期CAGR有望高達(dá)38%
GF Securities的分析師們在給客戶的報告中寫道:“作為AI基礎(chǔ)設(shè)施建設(shè)的核心協(xié)調(diào)器,服務(wù)器CPU在過去幾個月獲得了顯著關(guān)注。這一趨勢受代理式AI/推理浪潮需求推動,由OpenClaw和Anthropic突破性成果驅(qū)動,后者年度經(jīng)常性收入(ARR)在四月份飆升至440億美元。例如,在最新的業(yè)績電話會議中,AMD預(yù)計到2030年服務(wù)器CPU總可尋址市場(TAM)年復(fù)合增長率將超過35%,英特爾(INTC)則表示向代理式AI的轉(zhuǎn)變正在推動CPU的史無前例結(jié)構(gòu)性需求,其中數(shù)據(jù)中心的CPU實際需求比例已經(jīng)從訓(xùn)練階段的GPU與CPU比率8:1收緊至人工智能(885728)推理階段的4:1?!?/p>
“根據(jù)我們的估算,假設(shè)推理占AI工作負(fù)載的90%,并假設(shè)到2030年AI服務(wù)器的GPU與CPU比率達(dá)到2:1,我們預(yù)計服務(wù)器CPU總可尋址市場在2026/2027年將分別增長54%/39%,并可能將在2030年CPU市場價值達(dá)到1350億美元,而2025年僅僅約為260億美元,五年期限的復(fù)合年增長率(CAGR)有望高達(dá)38%。此外,我們預(yù)計2026/2027/2028年的新增服務(wù)器CPU需求分別為670萬、760萬和630萬單位臺,同期總需求將達(dá)到3000萬、3800萬和4400萬臺,意味著三年復(fù)合年增長率(CAGR)約為23%?!盙F Securities的分析師們寫道。
在接下來的深入分析報告中,GF Securities指出,由于x86架構(gòu)的CPU仍是數(shù)據(jù)中心服務(wù)器領(lǐng)域的最主流指令集架構(gòu),AMD和英特爾(INTC)無疑將成為CPU超級周期(883436)的最主要受益者。
分析師們解釋道:“從基本面角度來看,英特爾(INTC)受益于持續(xù)的產(chǎn)能加速轉(zhuǎn)化及第二季度CPU價格大幅上漲,這在我們4月16日的報告中已有說明。對于AMD,憑借穩(wěn)健的產(chǎn)品更新迭代路線圖和相對充足的產(chǎn)能,我們預(yù)計其市場份額將繼續(xù)提升。目前我們預(yù)計,英特爾(INTC)旗下的DCAI業(yè)務(wù)和AMD的數(shù)據(jù)中心服務(wù)器CPU業(yè)務(wù)營收在2026年將分別增長39%和73%?!?/p>
英特爾(INTC)還可能在下一代AI服務(wù)器CPU中獲得更大規(guī)模市場份額,其Xeon 6中央處理器可能將與英偉達(dá)(NVDA)即將量產(chǎn)的Rubin NVL8算力集群中的自研ARM架構(gòu)CPU配合使用,即其中一部分Vera Rubin搭載x86架構(gòu)CPU,另一部搭載英偉達(dá)(NVDA)自研基于ARM架構(gòu)的Vera CPU;AMD的Venice CPU則可能部署在其下一代的Helios機(jī)架系統(tǒng)和8-GPU AI服務(wù)器算力集群中。
盡管x86仍為主流架構(gòu),但該公司認(rèn)為基于ARM架構(gòu)的服務(wù)器CPU也可能呈現(xiàn)出加速增長,通過英偉達(dá)(NVDA)自研的ARM架構(gòu)服務(wù)器CPU——Vera系列算力集群及搭載專用應(yīng)用集成電路(885756)(即搭載AI ASIC),其中包括亞馬遜(AMZN)(AMZN.US)自研的Graviton 5、谷歌(GOOGL.US)自研的Axion 2——都是基于ARM架構(gòu)打造的自研服務(wù)器CPU。
分析師們補充道:“英偉達(dá)(NVDA)已為數(shù)據(jù)中心客戶推出獨立Vera CPU機(jī)架(256個CPU),早期采用者包括阿里巴巴(BABA)、CoreWeave(CRWV)、Meta(META)和Oracle(甲骨文(ORCL))。在谷歌生態(tài)系統(tǒng)內(nèi),TPU算力體系的GPU與CPU比率正在從之前的4:1調(diào)整至4:2。結(jié)合2026年以后的更加強(qiáng)勁TPU算力需求前景,我們預(yù)計Axion 2出貨將進(jìn)一步加速。同時,亞馬遜(AMZN)AWS自研的Graviton 4/5也在通過Teton Max機(jī)架(18個CPU)及Meta(META)的獨立Graviton機(jī)架獲得推動。對于Arm公司本身而言,該公司則將AGI CPU需求上調(diào)至200億美元?!?/p>
GF Securities的分析師們還認(rèn)為,最近宣布重新進(jìn)入數(shù)據(jù)中心CPU市場的高通(QCOM)正在“積極開發(fā)”2028年的數(shù)據(jù)中心CPU產(chǎn)品線,并預(yù)計將在6月24日的投資者日獲得更多信息。
分析師們補充道:“在基準(zhǔn)樂觀情景下,假設(shè)高通(QCOM)在2028年獲得30%的ARM架構(gòu)CPU市場份額(意味著約400萬臺單位,平均售價3000美元,凈利潤率大約30%),其帶來的凈利潤將為36億美元,相當(dāng)于其全年非GAAP利潤大幅提升約30%。”
據(jù)了解,高通(QCOM)在數(shù)據(jù)中心CPU以及AI芯片領(lǐng)域的最新技術(shù)動態(tài)顯示,它已經(jīng)從傳統(tǒng)的智能手機(jī)芯片設(shè)計商向數(shù)據(jù)中心AI基礎(chǔ)設(shè)施供應(yīng)商戰(zhàn)略性擴(kuò)張。高通(QCOM)已經(jīng)宣布重新進(jìn)入數(shù)據(jù)中心CPU市場,這與其過去僅聚焦移動SoC領(lǐng)域的定位明顯不同,該公司確認(rèn)正在開發(fā)定制數(shù)據(jù)中心CPU,并計劃這些CPU能夠與英偉達(dá)(NVDA)AI GPU加速器架構(gòu)(如NVLink fusion(BMEA)互連)協(xié)同工作,從而適應(yīng)未來AI服務(wù)器的要求。值得注意的是,在2010年代中期就曾推出過基于ARM架構(gòu)的Centriq 2400服務(wù)器處理器,具備高核心數(shù)且面向云計算(885362)及高吞吐量工作負(fù)載,這表明其在數(shù)據(jù)中心CPU設(shè)計上擁有一定經(jīng)驗。
在數(shù)據(jù)中心級AI加速器方面,高通(QCOM)已經(jīng)推出了面向大規(guī)模AI推理的產(chǎn)品線——AI200和AI250加速器,這兩款高性能AI芯片專為數(shù)據(jù)中心AI推理工作負(fù)載設(shè)計,并計劃在2026年和2027年陸續(xù)商業(yè)化,這標(biāo)志著高通(QCOM)正試圖建立與CPU協(xié)同的AI芯片產(chǎn)品線,以便在AI推理及agentic AI(即ai智能體(886099))等新興工作負(fù)載中發(fā)揮作用。它們基于高通(QCOM)獨家的Hexagon NPU架構(gòu),優(yōu)化了內(nèi)存容量和能源(850101)效率,并可配置為數(shù)據(jù)中心機(jī)柜級(rack scale)解決方案,這意味著高通(QCOM)正在追趕英偉達(dá)(NVDA)和AMD在大型AI算力基礎(chǔ)設(shè)施領(lǐng)域的部署能力,同時力爭打造出低TCO(總擁有成本)的AI推理平臺。
