5 月19日,聯(lián)想在北京舉辦“天禧AI一體多端全場(chǎng)景超能之夜”,正式發(fā)布專為智能體打造的AI原生個(gè)人家庭邊緣設(shè)備——聯(lián)想AI主機(jī)P7。該設(shè)備搭載后摩智能專為大模型在端邊側(cè)推理打造的AI芯片M50,憑借存算一體架構(gòu),在僅手掌大小的機(jī)身內(nèi)流暢運(yùn)行最高1220億參數(shù)本地大模型。
后摩智能M50已進(jìn)入量產(chǎn)階段,P7的問(wèn)世,代表著M50高能效端邊側(cè)推理能力正引領(lǐng)AI創(chuàng)新硬件進(jìn)入可高效運(yùn)行千億參數(shù)大模型的新時(shí)代。
M50 撐起千億參數(shù)大模型端側(cè)推理
聯(lián)想AI主機(jī)P7的端側(cè)算力核心——后摩智能M50,讓這臺(tái)僅重300g的設(shè)備,具備190TOPS本地AI算力,最高支持1220億參數(shù)大模型本地部署。無(wú)網(wǎng)環(huán)境下,本地自主推理速度可達(dá)50Tokens/s;配合最高80GB內(nèi)存和128K上下文窗口,復(fù)雜任務(wù)亦可流暢處理;整機(jī)最大功耗僅30W,普通移動(dòng)電源即可驅(qū)動(dòng),運(yùn)行噪音低于35dBA。
隨著Agent時(shí)代到來(lái),云端算力成本高企、Tokens消耗激增、網(wǎng)絡(luò)延遲受限等問(wèn)題日益凸顯。M50提供的可媲美云端的端側(cè)算力,極致高效的性能、靈活方便的部署形態(tài),正成為AI硬件廠商打造高算力創(chuàng)新終端的首選。
一機(jī)雙模,口袋里的免費(fèi)Token工廠
基于后摩智能M50提供的大算力基座,聯(lián)想AI主機(jī)P7提供“一機(jī)雙?!毙滦螒B(tài)。智能體模式下,P7在本地運(yùn)行天禧Claw,復(fù)雜任務(wù)最大化在本地執(zhí)行;大模型模式下,P7提供API Key,開放接入各類ai應(yīng)用(886108)和智能體,秒變本地免費(fèi)Token工廠,使用戶擺脫云端付費(fèi)焦慮。
此外,聯(lián)想AI主機(jī)P7可7×24小時(shí)連續(xù)執(zhí)行任務(wù),輕小便攜,用戶可隨身攜帶作為口袋AI工作站使用,在無(wú)網(wǎng)情況下P7持續(xù)提供穩(wěn)定的端邊側(cè)推理服務(wù)。數(shù)據(jù)隱私性得到有效保護(hù),數(shù)據(jù)不出端,在本地存儲(chǔ)和處理。
聯(lián)想AI主機(jī)P7將于7月1日正式開啟眾籌。P7的量產(chǎn)上市,標(biāo)志著后摩智能M50成功打破算力壁壘,真正實(shí)現(xiàn)千億級(jí)參數(shù)大模型從云端下沉、走進(jìn)消費(fèi)(883434)級(jí)AI創(chuàng)新終端。憑借卓越的能效比與端邊側(cè)推理能力,M50讓AI硬件以更低功耗承載更高密度算力,大幅降低端邊側(cè)AI規(guī)模化普及門檻。未來(lái),后摩智能將持續(xù)以極致能效推動(dòng)AI端邊側(cè)硬件創(chuàng)新,用最小能耗釋放最大智能。
