5月15日,全新一代理想L9將正式上市。今年年初,理想汽車(LI)宣布企業(yè)愿景升級(jí)為“成為全球領(lǐng)先的具身智能企業(yè)”。全新理想L9 LIvis,正是這條路上的第一款旗艦產(chǎn)品。
關(guān)于未來(lái),理想汽車(LI)董事長(zhǎng)兼CEO李想有一個(gè)清晰而篤定的判斷:自動(dòng)駕駛是具身智能的上半場(chǎng),通用人形機(jī)器人(886069)是具身智能的下半場(chǎng)。
以下是李想與羅永浩在《羅永浩的十字路口》欄目中的訪談?wù)?。在近三個(gè)小時(shí)對(duì)談中,李想完整闡述了公司轉(zhuǎn)型的戰(zhàn)略邏輯,從AI的底層認(rèn)知,到自研芯片的投入,再到對(duì)“家”的終極想象,李想給出了他的答案。
01
AI,既是生產(chǎn)力,也是勞動(dòng)力。
羅永浩:距離咱們上次聊已經(jīng)兩百多天了,這段時(shí)間你怎么樣?
李想:我在持續(xù)地認(rèn)知和學(xué)習(xí)AI。AI這東西你不能聽別人講,得自己真正去用。從Claude Code到OpenClaw,都從我自己開始,讓同事們?nèi)パb、去用。比如原來(lái)汽車之家(ATHM)的CTO,絕對(duì)的技術(shù)達(dá)人,但我給他講Claude Code,講了很多遍他都不用。后來(lái)我直接去他家,給他電腦上裝好;買了二十美金的套餐,第二天上午額度就用完了,立刻充值。這有點(diǎn)像當(dāng)年的iPhone,很多人拒絕用,但只要讓他拿著用一下,就不一樣了。所以我就開始在公司里,給我能裝的所有人去裝。
羅永浩:我們播客里AI聊得比較多,觀眾的反饋是——科技圈自嗨,跟我沒關(guān)系,我也沒興趣。怎么能讓普通用戶也真正感知到,除了提問和搜索之外,AI那些巨大的能量?
李想:不太容易。這一波AI最大的變化,是它既是生產(chǎn)力,又是勞動(dòng)力——而這兩者都必須依賴真實(shí)的生產(chǎn)環(huán)境。
現(xiàn)在用Agent用得最好的,是那些有完整業(yè)務(wù)環(huán)境的人。我們有同事一天能消耗上億Token,在干什么?在把自己的業(yè)務(wù)流程用Agent重構(gòu)。他說(shuō)感覺像在玩經(jīng)營(yíng)游戲(881275),因?yàn)樽约耗荛]環(huán)了。但普通個(gè)人沒有這種生產(chǎn)環(huán)境,玩一玩就沒反饋,自然沒意思。
還有一個(gè)大家誤解很深的點(diǎn):很多人說(shuō)專業(yè)工作會(huì)被AI替代。這是我真正用了以后,覺得這是最站不住腳的判斷。專業(yè)的人有了AI,會(huì)進(jìn)入到另外一個(gè)高度——原來(lái)是兩三倍的優(yōu)勢(shì),現(xiàn)在是十倍、一百倍。而這個(gè)高度,如果不是專業(yè)人才,是替代不了的。
02
關(guān)于具身智能:自動(dòng)駕駛是上半場(chǎng),通用人形機(jī)器人(886069)是下半場(chǎng)。
羅永浩:老百姓一說(shuō)具身智能,首先想到機(jī)器人。你能不能給大家解釋下,廣義的具身智能應(yīng)該理解到什么程度?
李想:物理世界里所有的機(jī)器,給了它傳感器(885946)、模型和處理器(分別對(duì)應(yīng)眼睛、大腦和心臟)以后,讓它來(lái)工作,它們都可以稱之為是具身智能??梢韵胂蟆蹲冃谓饎偂?,車的形態(tài)是機(jī)器人,人的形態(tài)也是機(jī)器人,飛機(jī)的形態(tài)也是機(jī)器人。具身智能不一定是人形的。
羅永浩:你是國(guó)內(nèi)新能源(850101)車企里第一個(gè)宣布要徹底地轉(zhuǎn)型做AI和具身智能的,這個(gè)決定背后有一個(gè)怎樣的思考過程?
李想:其實(shí)并非第一個(gè),但我們只是不繞圈子了,具身智能就是具身智能,它的定義很清晰,不需要發(fā)明一個(gè)新的名詞再解釋它。我覺得不用非得把汽車和機(jī)器人分開。一句話來(lái)講明白,具身智能是個(gè)龐大產(chǎn)業(yè),會(huì)細(xì)分成各種形態(tài),但自動(dòng)駕駛和通用人形機(jī)器人(886069)必然是占比最大的兩類,并分別是具身智能的上下半場(chǎng)。這二者的連接關(guān)系非常清楚,這也是為什么機(jī)器人公司要從自動(dòng)駕駛公司挖人。
整個(gè)自動(dòng)駕駛有三個(gè)階段——
第一階段,輔助駕駛(2018—2023年):關(guān)鍵技術(shù)包括CNN 2D神經(jīng)網(wǎng)絡(luò)、規(guī)則算法模型MCU控制器、算力在100TOPS以內(nèi),相當(dāng)于賦予了AI眼睛,更好地看到這個(gè)世界。
第二階段,L3自動(dòng)駕駛(當(dāng)下至2028年):傳感器(885946)基于Transformer升級(jí)為 2D ViT,預(yù)訓(xùn)練模型模仿學(xué)習(xí)+端到端控制,約2000TOPS算力。
第三階段,L4無(wú)人駕駛(885736)(2028—2033年):需要3D ViT、面向物理世界的穩(wěn)定預(yù)訓(xùn)練模型、接近10,000TOPS算力。
L4實(shí)現(xiàn)那天,汽車就真正成了機(jī)器人。所以——自動(dòng)駕駛是具身智能的上半場(chǎng),通用人形機(jī)器人(886069)是下半場(chǎng)。
我們內(nèi)部用人類年齡來(lái)劃分機(jī)器人的成長(zhǎng)階段:第一階段是6歲孩子的物理泛化能力,第二階段12歲,第三階段18歲——接近AGI。
只要做了自己的芯片、建了自己的模型,看這個(gè)世界往下走的路徑,就會(huì)變得相對(duì)清晰。
羅永浩:把自己定義成一家具身智能公司,內(nèi)部有阻力嗎?
李想:沒什么阻力。因?yàn)榇蠹夷芸吹轿业臎Q心,我怎么分配研發(fā)預(yù)算、最難的時(shí)候停不停AI項(xiàng)目——這些行動(dòng)才是決心的證明,不是嘴上說(shuō)說(shuō)。
我自己的判斷很清楚:我們做AI,不是冒險(xiǎn)。不做,才是真正的冒險(xiǎn)。
03
全新理想L9 LIvis:三個(gè)核心升級(jí)。
羅永浩:全新理想L9 Livis這代車,跟前邊有哪些本質(zhì)的差別?
李想:有三個(gè)核心升級(jí)。
第一,完全體線控底盤加800V主動(dòng)懸架。這是我們過去幾年認(rèn)真補(bǔ)的一塊差距——中國(guó)車企的底盤技術(shù),過去相比歐洲企業(yè)是有差距的。借助電動(dòng)化的優(yōu)勢(shì),這一次實(shí)現(xiàn)了真正超越。這套底盤是專門為L(zhǎng)3、L4設(shè)計(jì)的,整體系統(tǒng)響應(yīng)速度,可以比人快接近一倍。
第二,自研芯片馬赫M100。理想汽車(LI)是全球首個(gè)應(yīng)用動(dòng)態(tài)數(shù)據(jù)流架構(gòu)芯片的車企,全新理想L9 LIvis的兩顆芯片總算力2560TOPS,單顆1280TOPS,是目前全球最強(qiáng)。
第三,全新第三代增程器加5C大電池。綜合續(xù)航1650公里,純電續(xù)航420公里,5C超充峰值功率420kW——相當(dāng)于把純電動(dòng)車的能力,直接給到了增程車。
羅永浩:這個(gè)全球首個(gè)完全體線控底盤,從用戶可感知的方面能展開說(shuō)說(shuō)嗎?
李想:最直接的是響應(yīng)速度。人類從看到障礙物到踩剎車執(zhí)行到位,大概350到400毫秒。過去的自動(dòng)駕駛系統(tǒng)也在這個(gè)量級(jí)。全新理想L9 LIvis全系統(tǒng)從感知到執(zhí)行可以降到200多毫秒,比人快接近一倍。在這個(gè)速度差下,剎車距離能差出去一個(gè)全尺寸SUV的車長(zhǎng)。
另外就是線控式的機(jī)械制動(dòng),四個(gè)輪子可以獨(dú)立控制,就會(huì)產(chǎn)生安全冗余。四個(gè)輪子里只要有一個(gè)輪子還能工作,車都能剎得住。
羅永浩:動(dòng)態(tài)數(shù)據(jù)流這個(gè)方案,你們是全球唯一一個(gè)在量產(chǎn)車上這么做的,當(dāng)時(shí)選這條路沒有賭的成分嗎?
李想:沒有賭。我們做了140萬(wàn)字的資料來(lái)驗(yàn)證這件事,也跟Jim Keller這樣的頂級(jí)處理器專家詳細(xì)聊過,他認(rèn)為這是AI未來(lái)主流的技術(shù)架構(gòu)。
傳統(tǒng)GPU架構(gòu)在端側(cè)已經(jīng)遇到了瓶頸。動(dòng)態(tài)數(shù)據(jù)流架構(gòu)的核心優(yōu)勢(shì)是:AI最重要的不是計(jì)算,是數(shù)據(jù)搬運(yùn)效率,這套架構(gòu)在這方面更高效。
用戶可感知的變化有兩點(diǎn):第一是幀率,就像打游戲(881275)從10幀變30幀,所有交互和響應(yīng)都更流暢;第二是模型規(guī)模變大了,車機(jī)會(huì)更聰明。
這里可以參考一段歷史:2022年的老款理想L9,配了當(dāng)時(shí)全球最強(qiáng)算力。四年后的今天,那批車的車機(jī)仍然流暢,所有新功能照樣有,智駕還在第一梯隊(duì)。你今天很難找到一款2022年的車,到現(xiàn)在智駕還是第一梯隊(duì)的。這是智能化帶來(lái)的最大好處——極強(qiáng)的算力,會(huì)讓車具備成長(zhǎng)性和生命力。我們能對(duì)所有的理想L9車主說(shuō),哪怕你是2022年買的車,四年過去,你的車還是沒有任何過時(shí)。
羅永浩:我很喜歡跟理想同學(xué)對(duì)話,但我還想跟它聊深入話題,讓通勤時(shí)間不浪費(fèi),隨時(shí)打開理想汽車(LI)App都能看到我和理想同學(xué)的對(duì)話記錄,繼續(xù)我未完的工作。你們?yōu)槭裁床唤觿e家的AI模型,類似豆包千問這些呢?
李想:你的需求,全新理想L9 LIvis就能滿足了。
而且我們重新想明白了一件事:一個(gè)用戶在車?yán)锲鋵?shí)有五種需求。
第一,泛化任務(wù),Agent來(lái)做——幫你完成具體的事;
第二,泛化信息獲取,Chatbot來(lái)做,要快,問天氣、找信息,一秒內(nèi)響應(yīng);
第三,精確控制,調(diào)空調(diào)(884113)、找App,用知識(shí)圖譜秒級(jí)完成,不需要燒幾萬(wàn)Token;
第四,記錄,不是記憶,是把你開車時(shí)的想法、問題及時(shí)留存下來(lái);
第五,個(gè)性化,幾個(gè)關(guān)鍵參數(shù)就夠。
不同的需求用不同的架構(gòu)處理,不能所有事都靠Agent——那效率太低了,動(dòng)不動(dòng)要等幾分鐘。
5月15日交付時(shí),這套架構(gòu)就搭建完成了。支持調(diào)用任何一家的模型,豆包、Kimi、千問都可以接,也可以用理想自己的模型。我們自己的模型,可能會(huì)比大家想象的好很多。
04
未來(lái),把最好的生活給到更多人。
羅永浩:你把自己定義成一家具身智能公司,車在你的長(zhǎng)期規(guī)劃里是一個(gè)重要的有機(jī)部分,而不是全部。那十年后,你希望理想是一家什么樣的公司?
李想:把過去只有頂級(jí)富豪才擁有的那種生活,通過AI技術(shù),給到更多的人。
那些超級(jí)富豪有什么?有司機(jī)——不只是開車,還是生活助理,幫你接孩子、跑腿;有家政、有保姆,回家就能吃飯,衛(wèi)生有人打掃。我們要做的,就是用L4無(wú)人駕駛(885736)替代司機(jī),讓家政機(jī)器人進(jìn)入家庭,讓幾億人、幾十億人都能消費(fèi)(883434)得起這種生活。
這才是科技進(jìn)步最大的價(jià)值——不是天天想著怎么用AI替代人的工作,而是把奢侈變成普世。
這是我們的用戶價(jià)值,也是理想的長(zhǎng)期定位:全球領(lǐng)先的具身智能企業(yè)。
