當(dāng)云計(jì)算(885362)的主要消費(fèi)(883434)者從人變成ai智能體(886099),整個(gè)技術(shù)體系該如何重寫?5月20日,阿里云在杭州峰會上給出了自己的答案——完成“芯片-云-模型-推理”全棧Agent化升級,同步發(fā)布旗艦?zāi)P蚎wen3.7-Max、搭載自研AI芯片真武M890的超節(jié)點(diǎn)服務(wù)器,以及全新AI產(chǎn)品官網(wǎng)“千問云”。這是國內(nèi)云廠商首次圍繞Agent進(jìn)行全棧產(chǎn)品發(fā)布。
阿里云資深副總裁劉偉光在主題演講中表示,Agent突破臨界點(diǎn)之后可以24小時(shí)不間斷工作,對AI和云的需求無窮無盡。阿里云正在進(jìn)行全棧技術(shù)革新,從底層芯片、Agentic Cloud、模型到推理平臺全面升級,建設(shè)中國最大的AI工廠。
千問3.7登頂國產(chǎn)第一
35小時(shí)自主進(jìn)化刷新極限
峰會上最重磅的發(fā)布無疑是旗艦?zāi)P蚎wen3.7-Max。在三方機(jī)構(gòu)Arena全球大模型盲測總榜中,Qwen3.7-Max超過Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,與GPT、Claude、Gemini最強(qiáng)模型接近,位列國產(chǎn)模型第一。近3個(gè)月內(nèi),千問旗艦大模型已穩(wěn)定迭代了3.5、3.6、3.7三個(gè)版本,保持著極高的發(fā)布節(jié)奏。
通義大模型事業(yè)部負(fù)責(zé)人周靖人在演講中指出,大模型正在經(jīng)歷一次核心范式轉(zhuǎn)移——從對齊人類偏好,到對齊任務(wù)目標(biāo)?!斑^去我們追求的是模型‘說得好’,現(xiàn)在要求模型‘做得到’。Qwen3.7-Max的設(shè)計(jì)初衷,就是讓模型真正成為Agent的智能內(nèi)核,具備自主規(guī)劃、持續(xù)迭代、跨工具協(xié)作的能力?!?/p>
千問3.7面向當(dāng)下智能體時(shí)代全新設(shè)計(jì),在編程、推理、工具調(diào)用、長程任務(wù)等核心能力上實(shí)現(xiàn)突破。在編程智能體方面,Qwen3.7-Max在Terminal Bench 2.0-Terminus得分69.7,超過DeepSeek-v4-pro-Max、Claude-Opus4.6等一眾模型;在推理能力上,在GPQA Diamond、HLE、HMMT 2026等核心測評中均超越了Claude-Opus4.6及所有國產(chǎn)模型。
比跑分更有說服力的是一個(gè)實(shí)戰(zhàn)案例。在訓(xùn)練時(shí)從未接觸過的平頭哥真武M890芯片上,Qwen3.7-Max僅憑一份任務(wù)說明,從零開始自主工作35小時(shí),獨(dú)立進(jìn)行了432次內(nèi)核評估、1158次工具調(diào)用,完全自主地完成了一個(gè)生產(chǎn)級AI計(jì)算內(nèi)核的編寫與調(diào)優(yōu),最終性能較官方版本提升10倍。沒有人類干預(yù),沒有中間指導(dǎo)——這展示的不是模型“回答問題”的能力,而是“自主完成復(fù)雜工程任務(wù)”的能力。
測試軌跡還顯示,模型在獨(dú)立運(yùn)行超30小時(shí)后仍發(fā)現(xiàn)了有效優(yōu)化點(diǎn),甚至主動(dòng)發(fā)起了一次關(guān)鍵的架構(gòu)重設(shè)計(jì)——這充分體現(xiàn)了千問在復(fù)雜任務(wù)中長周期(883436)自主迭代的能力,為未來模型與智能體的自我演進(jìn)打開了全新的想象空間。
從芯片到官網(wǎng)
全棧為Agent重構(gòu)
模型之外,阿里云更大的野心在于將整個(gè)技術(shù)體系為Agent重寫。
芯片層,阿里發(fā)布基于新一代AI芯片真武M890的磐久AL128超節(jié)點(diǎn)服務(wù)器,搭載自研互聯(lián)芯片ICN Switch 1.0,可讓128張AI芯片組成一臺計(jì)算機(jī),P2P時(shí)延低于150ns。真武M890首次亮相,配備144GB顯存,片間互聯(lián)帶寬800GB/s,性能是上一代真武810E的3倍。平頭哥同時(shí)公布了未來兩年將陸續(xù)推出真武V900、真武J900兩代芯片的路線規(guī)劃,目前真武系列AI芯片累計(jì)出貨56萬片。
云平臺層,阿里云提出了“Agentic Cloud”的概念。傳統(tǒng)云產(chǎn)品的設(shè)計(jì)邏輯是面向人的——控制臺、菜單、配置項(xiàng),這些視覺化信息對人友好,但對Agent毫無意義。阿里云首席技術(shù)官李飛飛認(rèn)為,Agent工作負(fù)載是“無規(guī)律彈性、短生命周期(883436)、瞬時(shí)起量即走”,與傳統(tǒng)云計(jì)算(885362)的穩(wěn)態(tài)負(fù)載截然不同。為此,阿里云對云產(chǎn)品進(jìn)行了Skill化、MCP化和CLI化改造,讓每一個(gè)云產(chǎn)品都變成Agent可以“像調(diào)函數(shù)一樣調(diào)用”的標(biāo)準(zhǔn)化能力模塊。
推理平臺層,百煉平臺通過并池調(diào)度、上下文緩存、吞吐彈性調(diào)度等技術(shù),應(yīng)對Agent場景下的海量并發(fā)推理需求。平臺還引入了Agentic RL——基于Agent實(shí)際執(zhí)行反饋的強(qiáng)化學(xué)習(xí)機(jī)制,讓模型在真實(shí)場景中越用越好。生態(tài)上,百煉除了阿里自研的千問模型矩陣,還將接入智譜(HK2513)GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可靈、Vidu Q3等第三方模型。
一行代碼替代整個(gè)官網(wǎng)
“千問云”押注Agent入口
最具象征意義的發(fā)布或許是全新產(chǎn)品官網(wǎng)“千問云”。這是阿里云成17年來,首次在阿里云官網(wǎng)之外推出的全新產(chǎn)品官網(wǎng)。打開頁面,沒有產(chǎn)品列表,沒有控制臺,沒有任何傳統(tǒng)意義上的導(dǎo)航結(jié)構(gòu),首頁只有一行字:“npx skills add QianWen-AI/qianwen-ai”。
這是一條Agent可讀的指令。阿里云將所有模型服務(wù)的核心能力封裝為標(biāo)準(zhǔn)化的Skills和CLI工具,智能體可以直接解析這條指令,“學(xué)會”網(wǎng)站的全部能力,并根據(jù)需求自主調(diào)用。過去十年,云的交互邏輯是“人登錄控制臺→選產(chǎn)品→配參數(shù)→調(diào)API”。現(xiàn)在,Agent只需要“讀”一條指令。
記者手記
劉偉光在演講中描繪了一幅引人深思的圖景:未來不是人給AI發(fā)指令的單向關(guān)系,而是人與Agent組成團(tuán)隊(duì)共同協(xié)作。一個(gè)人可以指揮一群Agent工作,甚至未來可能反過來——一群Agent指揮一個(gè)人工作?!拔磥砦易约耗懿荒芙邮芤粋€(gè)Agent做我的manager?”他開玩笑說,“這可能是今天看來的科幻片,但可能在不久將來就會發(fā)生?!?/p>
封面新聞?dòng)浾?歐陽宏宇
