Robotaxi 這個(gè)行業(yè)就像一顆網(wǎng)球落在地上,反復(fù)上下彈跳,一直在等待有人發(fā)出最有力的一擊揮拍,把球擊過(guò)欄網(wǎng)。
一年前看起來(lái)是這顆網(wǎng)球彈跳的最高點(diǎn),Robotaxi 從武漢火到了全國(guó),許多人開始好奇坐無(wú)人出租車是一種什么體驗(yàn)。
一年后 Robotaxi 又來(lái)到了小高峰期,馬斯克不再跳票,準(zhǔn)時(shí)于 6 月 22 號(hào)在美國(guó)奧斯汀運(yùn)營(yíng)特斯拉 Robotaxi。天降大任于斯人也,很多人寄希望于馬斯克,希望這個(gè)如神般的人物能帶領(lǐng)特斯拉率先在奧斯汀完成盈利。
但 Robotaxi 行業(yè)還沒(méi)有因?yàn)樘厮估尤刖图铀?,特斯拉目前也沒(méi)有因?yàn)檫M(jìn)入 Robotaxi 行業(yè),就跳過(guò)其中任何一步。
特斯拉的 Robotaxi 仍然必須從一個(gè)城市、幾條固定線路、10-20 臺(tái)車、邀請(qǐng)制開始試運(yùn)營(yíng),然后再逐步擴(kuò)大到其他區(qū)域。
有些人瘋狂吹噓 Robotaxi,因?yàn)檫@可能企業(yè)市值的下一個(gè)增長(zhǎng)點(diǎn)。有些人出于對(duì)自動(dòng)駕駛的技術(shù)自信啟程,卻被繁雜的商業(yè)化運(yùn)營(yíng)束縛住手腳。
如果把這兩種人都從 Robotaxi 的道路上驅(qū)逐出去,這條道路就顯然會(huì)空曠很多。
當(dāng)我們談?wù)?Robotaxi 時(shí),至少應(yīng)該談?wù)撘恍┲蛔?a class="link2" href="http://ewshbmdt.cn/tag/無(wú)人駕駛" target="_blank">無(wú)人駕駛技術(shù)的公司,樓天城是其中一個(gè),他的公司小馬智行去年以「Robotaxi 第一股」在納斯達(dá)克上市,他和另一位創(chuàng)始人彭軍一起敲了鐘,現(xiàn)在小馬智行美股市值接近 400 億人民幣。
但上市顯然也不是這顆網(wǎng)球被擊出越網(wǎng)的一瞬間。
外界對(duì) Robotaxi 還存在著太多困惑,樓天城感嘆「其實(shí)人對(duì)于看到比自己車技更好的電腦,第一反應(yīng)是不接受的?!?/p>
我們和樓天城聊了兩次,一次發(fā)生在上海車展期間,他們剛剛發(fā)布第七代 Robotaxi,一次發(fā)生在特斯拉開啟試運(yùn)營(yíng)的兩天前,樓天城也申請(qǐng)了特斯拉 Robotaxi 的試乘,但沒(méi)有被通過(guò)。
通過(guò)兩次聊天,我發(fā)現(xiàn)他和我想象中一樣在乎一臺(tái) Robotaxi 的成本,但他抱怨很多人沒(méi)弄明白真正的成本在哪,在無(wú)人車上討論去掉最多占成本 10% 的激光雷達(dá)、1% 的高精地圖,就像在西瓜瓤里面挑籽。
但是他卻沒(méi)有想象中那么在乎特斯拉的入局,在他眼里,即便特斯拉開啟試運(yùn)營(yíng),但依舊還沒(méi)上 Robotaxi 的牌桌。他認(rèn)為小馬走過(guò)的路,這些公司一步都不會(huì)少走。
差別在于時(shí)間。從 2021 年小馬發(fā)布第一代全無(wú)人車型起,到今年小馬把 Robotaxi 運(yùn)營(yíng)規(guī)模拓展到接近上千輛,用了 4 年時(shí)間。
Robotaxi 遠(yuǎn)非大多數(shù)人想象中大火烹油、聲勢(shì)浩大,更接近于熬糖漿,把白砂糖倒進(jìn)去,加水倒進(jìn)去慢慢熬,但凡水多一點(diǎn)、少一點(diǎn),火大一點(diǎn)、小一點(diǎn),都不是那種最完美的琥珀色。
「熬」聽起來(lái)很掙扎,在小馬只有不到一百臺(tái)車的時(shí)候,他擔(dān)心第 101 輛的時(shí)候還需要用手敲,當(dāng)世界模型這個(gè)技術(shù)解法被找到時(shí),樓天城找回了那種信心。
有趣的是,世界模型解決 L4 自動(dòng)駕駛的本質(zhì)就是「活久見」,活得越久,看到的東西越多,會(huì)得就越多。
解法也在于時(shí)間。
「Robotaxi 商業(yè)化漫長(zhǎng)的等待時(shí)間已經(jīng)過(guò)去了,我們已經(jīng)不再 struggle 了」。樓天城如是說(shuō)。
01、漫長(zhǎng)的等待已經(jīng)過(guò)去了
汽車之心:去年武漢關(guān)注潮之后,Robotaxi 好像又不火了。如果不實(shí)現(xiàn)真正的商業(yè)化,這個(gè)行業(yè)就沒(méi)有真正意義上的關(guān)注度?
樓天城:這個(gè)行業(yè)沒(méi)有得到大眾真正的關(guān)注,在于服務(wù)還不夠好。
不光是自動(dòng)駕駛,AI 吸引人的方式一直都是依靠好用。
Deepseek 你覺得他是因?yàn)槭裁次??其?shí)是它好用。AI 真正被人認(rèn)可,只會(huì)因?yàn)樗懈哔|(zhì)量的服務(wù),剛開始創(chuàng)業(yè)的時(shí)候我就這么想的,現(xiàn)在我還這么想。
汽車之心:你說(shuō)過(guò)特斯拉還沒(méi)上牌桌,那你怎么看特斯拉在奧斯汀開啟無(wú)人化運(yùn)營(yíng)?
樓天城:今天我也這么認(rèn)為,強(qiáng)如馬斯克,在 Robotaxi 上也得一步一步來(lái)。
2015 年 Waymo 也在奧斯汀第一次做無(wú)人化展示。可以想一想看為什么大家都在同一個(gè)地方?
是因?yàn)閵W斯汀是道路相對(duì)可控的沙漠區(qū)域。去年馬斯克推遲了 2 個(gè)月開了 Robotaxi 發(fā)布會(huì),一年過(guò)去他才在奧斯汀又放了 10-20 輛車,以及奧斯汀的部分區(qū)域運(yùn)營(yíng)。
這種分階段的做法其實(shí)就是 Robotaxi 發(fā)展的方向,即便是特斯拉,也需要從 1 到 10 往前走,下一步特斯拉可能會(huì)提升車速、覆蓋整個(gè)奧斯汀,從只有 10 輛車再到讓更多人打到車。
上周我在美國(guó),也申請(qǐng)了幾次體驗(yàn)特斯拉 robotaxi,但都沒(méi)通過(guò)。
汽車之心:你提到了規(guī)模,Robotaxi 規(guī)模從 1 到 10,從 10 到 100,從 100 到 1000 輛,不同的車隊(duì)規(guī)模會(huì)經(jīng)歷哪些難點(diǎn)?
樓天城:從 1 到 10 輛是邀請(qǐng)制,一切是可控的。坐哪輛車、線路、運(yùn)營(yíng)區(qū)域都是固定的,我們最早在廣州南沙坐無(wú)人車 Demo 的時(shí)候路線也是自己定的,選的是狀態(tài)最好的車運(yùn)行。
從 10 到 100 輛的階段已經(jīng)在靠千輛的方式運(yùn)行,區(qū)別是 10 到 100 的階段不會(huì)再去控制路線和場(chǎng)景。今天能做到 10 到 100 的公司已經(jīng)非常少,特斯拉也沒(méi)有做到,根本原因是大家的車沒(méi)有處理區(qū)域內(nèi)所有場(chǎng)景的能力。
只有規(guī)模做到上百臺(tái),才勉強(qiáng)叫「上了 Robotaxi 牌桌」。
從 100 到 1000 輛的難點(diǎn)跟從 10 到 100 的差別在于降低成本的前提下,做出和原來(lái)一樣的效果。
用金子一樣做出的東西,當(dāng)然很好用。比如原來(lái)激光雷達(dá)十幾萬(wàn)一個(gè),現(xiàn)在每年都在更新,價(jià)格降到了幾百塊。但從十幾萬(wàn)降到幾百塊,也逃不過(guò)「一分錢一分貨」,幾百的東西比十幾萬(wàn)的信噪比可能高出了 30 倍,那我們就必須要用軟件提升 Network,吃掉這 30 倍的信噪比。
而從 1000 到 10000 輛,難度就沒(méi)那么大了,因?yàn)?L4 泛化能力很強(qiáng),但擴(kuò)展到更多城市,會(huì)對(duì)基礎(chǔ)設(shè)施要求更多一些。
所以,最難的是從 10 到 100 輛、從 100 到 1000 輛這兩步。
汽車之心:小馬智行單臺(tái) Robotaxi 日均訂單量 15 單,這個(gè)數(shù)字是什么水平?
樓天城:每輛車日均 15 單已經(jīng)是符合 Robotaxi 正常需要、比較成熟的數(shù)字了,如果有人能把這個(gè)數(shù)字提上去很多,才會(huì)讓我驚訝。
但是車輛規(guī)模和等待時(shí)間是有很多空間的。
規(guī)模增加對(duì)整體單量有很大幫助。如果規(guī)模太小,每一次車輛接單距離就會(huì)變長(zhǎng),車輛稀疏會(huì)造成用戶等待時(shí)間就會(huì)變長(zhǎng),最終也會(huì)變成體驗(yàn)問(wèn)題。
現(xiàn)階段車輛規(guī)模增加有助于提升體驗(yàn),我不是說(shuō)具體車輛數(shù)量漲到多少,而是當(dāng)下階段,提升規(guī)模是可以增加單量,今年我們會(huì)進(jìn)入千臺(tái)規(guī)模。
汽車之心:小馬智行有三大塊業(yè)務(wù) Robotaxi、Robotruck 和技術(shù)授權(quán),但 Robotaxi 對(duì)小馬營(yíng)收的貢獻(xiàn) 2024 年上半年只有 4.7%,且呈下降趨勢(shì),這是為什么?
樓天城:財(cái)報(bào)里的營(yíng)收要分開看,一個(gè)是狹義的 Robotaxi 營(yíng)收,就是車輛在外面接單,乘客付錢的盈利。另一個(gè)是廣義的營(yíng)收,比如我們還有項(xiàng)目之外的合作,車輛轉(zhuǎn)賣給其他方,有一次性的項(xiàng)目收入在里面,有項(xiàng)目周期的緣故,才會(huì)給大家營(yíng)收下降的感覺。
現(xiàn)在因?yàn)槲覀兪巧鲜泄荆也荒芊窒砭唧w數(shù)字,但我單純看 Robotaxi 的數(shù)字,我可以說(shuō)增長(zhǎng)非常多。
汽車之心:那你有沒(méi)有想過(guò)這三類業(yè)務(wù),什么樣的業(yè)務(wù)貢獻(xiàn)比例是理想狀態(tài)?
樓天城:Robotaxi 占到九成甚至更多才是我們的理想狀態(tài)。但 Robotruck 單量增長(zhǎng)后,會(huì)如何和 Robotaxi 分比,這會(huì)是一個(gè)很有意思的問(wèn)題。
汽車之心:你們當(dāng)初為什么要做 Robotruck,跟 Robotaxi 相比哪個(gè)業(yè)務(wù)會(huì)更快毛利轉(zhuǎn)正?
樓天城:我們當(dāng)初會(huì)做 Robotruck,并不代表是它會(huì)比 Robotaxi 先盈利,而是因?yàn)樗俏ㄒ荒茉谧詣?dòng)駕駛程度上能和 Robotaxi 比較的市場(chǎng)。
這里還有個(gè)聽起來(lái)很反直覺的東西,本質(zhì)上 Robotruck 比 Robotaxi 更難做到無(wú)人。
事實(shí)上現(xiàn)在世界上還沒(méi)有任何一輛 Robotruck 在公開道路上無(wú)人常態(tài)化運(yùn)營(yíng)。原因很好理解,第一,卡車出事故的后果更嚴(yán)重,對(duì)安全性要求非常高,整個(gè)開發(fā)驗(yàn)證過(guò)程都需要更長(zhǎng)時(shí)間。
第二,卡車的場(chǎng)景簡(jiǎn)單,技術(shù)更好實(shí)現(xiàn),這是嚴(yán)重的思維誤區(qū)。因?yàn)楹?jiǎn)不簡(jiǎn)單都要達(dá)到超過(guò)人的水平,所以簡(jiǎn)單不一定是好事,就比如你希望在班里考第一名、第二名,這跟題目簡(jiǎn)不簡(jiǎn)單沒(méi)有關(guān)系,簡(jiǎn)單你也需要考這個(gè)成績(jī)。
汽車之心:為什么你們 Q1 財(cái)報(bào)還處于增收不增利的狀態(tài)?
樓天城:我認(rèn)為我們的財(cái)報(bào)狀態(tài)符合這個(gè)階段表現(xiàn)出的認(rèn)知,整個(gè)行業(yè)都需要更長(zhǎng)時(shí)間積累才能到下一個(gè)階段。
汽車之心:你們現(xiàn)在做無(wú)人車域控給美團(tuán),接下來(lái)會(huì)不會(huì)下場(chǎng)做低速無(wú)人車?
樓天城:我們有信心能做無(wú)人小車,但是 Robotaxi 和無(wú)人小車的市場(chǎng)價(jià)值天差地別。
Elon Musk 說(shuō)過(guò) Robotaxi 是八萬(wàn)億美元的市場(chǎng),無(wú)人小車不會(huì)比這個(gè)市場(chǎng)更大,兩者之間跟不說(shuō)差 2 個(gè) 0,差一個(gè) 0 是肯定有的,所以我何必去聚焦一個(gè)價(jià)值只有 1/10 的東西呢?
我有能力、有信心去做價(jià)值更高的事情,我就會(huì)聚焦在 Robotaxi 上,我不會(huì)因?yàn)樵O(shè)置了高目標(biāo),做不到之后,先去做其他東西。我還是希望大家奔著真正有價(jià)值的事情去做。
汽車之心:聽起來(lái)有點(diǎn)樂(lè)觀,Robotaxi 的商業(yè)化很漫長(zhǎng)。
樓天城:這種漫長(zhǎng)等待的時(shí)間已經(jīng)過(guò)去了。我對(duì) Robotaxi 的信心不是今天才有的。
02、大多數(shù)人談降本,卻沒(méi)搞對(duì)成本在哪
汽車之心:小馬的策略是更優(yōu)的成本結(jié)構(gòu)下擴(kuò)規(guī)模,什么樣的成本結(jié)構(gòu)算優(yōu)質(zhì)?以及把單車成本做到不虧錢,這個(gè)要分幾步做才能不虧?
樓天城:成本和規(guī)模是相關(guān)的。降本是關(guān)鍵,真正做的人會(huì)明白問(wèn)題的關(guān)鍵是「成本主要在哪?」但降本不在于用不用激光雷達(dá)、高精地圖,他們都不是成本的關(guān)鍵因素。大家在說(shuō)降本的時(shí)候,根本沒(méi)有搞對(duì)成本是什么。
第一個(gè)關(guān)鍵因素是,一定要先做到無(wú)人。
第二個(gè)因素是車規(guī)零部件。Robotaxi 之前還有很多非車規(guī)件,比如小馬智行第五代無(wú)人車頭頂有一顆旋轉(zhuǎn)的機(jī)械激光雷達(dá),車上有這個(gè)東西就沒(méi)有計(jì)算成本的必要了。早年間,我們買的第一個(gè)機(jī)械激光雷達(dá) 85 萬(wàn)人民幣,但現(xiàn)在固態(tài)激光雷達(dá)的成本明顯下降,都是以千元計(jì)算。
現(xiàn)在要解決的是,能不能在用性價(jià)比高的核心零部件的時(shí)候,還保障性能水平不下降。
第三個(gè)因素跟運(yùn)營(yíng)相關(guān)?,F(xiàn)在我們還有遠(yuǎn)程協(xié)助專員,比如車輛擁堵的時(shí)候會(huì)有一些詢問(wèn)。之后降本的關(guān)鍵也在考驗(yàn)?zāi)懿荒馨堰\(yùn)營(yíng)流程變得足夠智能,一個(gè)人就能管五十輛車。
第四個(gè)因素就是保費(fèi),每一年給 Robotaxi 上保也是一筆很大的錢。
算完這些,今天在我們的無(wú)人車?yán)?,激光雷達(dá)能占到成本 10% 已經(jīng)很不錯(cuò)了,我犯不著天天為 10% 糾結(jié),而高精地圖可能 1% 成本都占不到。
在這些之外,有一個(gè)非常反直覺的大頭成本——其實(shí)是網(wǎng)費(fèi)。
很多車企依靠路網(wǎng)收集數(shù)據(jù)來(lái)幫助訓(xùn)練,這是個(gè)悖論,因?yàn)槿绻@么多數(shù)據(jù),網(wǎng)費(fèi)會(huì)爆炸。邏輯是:你愿意為收集數(shù)據(jù),付多少網(wǎng)費(fèi),而不是你有多少車,收集多少數(shù)據(jù)。
今天 Robotaxi 不太存在接管,可能因?yàn)榉较虼虻锰边@種情況才要收集數(shù)據(jù),即便如此,網(wǎng)費(fèi)依然占了我們成本的大頭。如果經(jīng)常接管,網(wǎng)費(fèi)占比極高,一輛車要付九倍錢去收集數(shù)據(jù)。
L4 去激光雷達(dá)是研究院做的事,從商業(yè)化來(lái)說(shuō),這些對(duì) Robotaxi 企業(yè)不重要,萬(wàn)一去了激光雷達(dá),我卻加了倆芯片,還不知道是虧了還是賺了。
第五個(gè)因素是隱形的原子化優(yōu)化。
比如把我們的模型縮小到原來(lái) 1/ 3,就只需要 1/ 3 的算力來(lái)做了。
大家過(guò)去有一個(gè)誤解,覺得算力越高越厲害,但那是從科研探索角度來(lái)說(shuō)的,從成本來(lái)說(shuō),肯定是模型壓得越小,用更小算力實(shí)現(xiàn)整個(gè)計(jì)算要求,還能降本,這樣的思路才是有利于發(fā)展的。比如原來(lái)我買 3 塊 BPU,現(xiàn)在就只買一塊了,這就省下了 2/3 的錢。
汽車之心:你剛剛提到網(wǎng)費(fèi),那么 Robotaxi 公司進(jìn)入海外市場(chǎng)可能會(huì)遇到很多網(wǎng)絡(luò)不好的地方,那么網(wǎng)絡(luò)對(duì)自動(dòng)駕駛出海會(huì)不會(huì)是一個(gè)巨大的問(wèn)題?
樓天城:網(wǎng)絡(luò)就算不出海也是一個(gè)巨大的問(wèn)題。我以前也做過(guò)網(wǎng)絡(luò),車本身只能接受百毫秒級(jí)別的網(wǎng)絡(luò)延遲,中國(guó)就算有 5G 其實(shí)支撐度也非常差。
所以我們很早就意識(shí)到 L4 要靠車自己而不能靠網(wǎng)絡(luò),網(wǎng)絡(luò)只是輔助給系統(tǒng)一些建議。所以我們的車網(wǎng)絡(luò)斷了駕駛也不會(huì)有任何問(wèn)題。
汽車之心:怎么去保證斷網(wǎng)系統(tǒng)也不出問(wèn)題?
樓天城:簡(jiǎn)單說(shuō)就是車端具有自動(dòng)駕駛模型能力,或者說(shuō)我需要最終在意的是我在車端的那個(gè)模型要足夠強(qiáng),而不是我在云端足夠強(qiáng)。
汽車之心:馬斯克之前說(shuō) Robotaxi 的成本能降到每英里 0.2 美元,這是 Robotaxi 的終極成本嗎?
樓天城:特斯拉還沒(méi)有上桌,Robotaxi 的牌桌是做到無(wú)人商業(yè)化的運(yùn)營(yíng),且要做到一定規(guī)模的。今天只有小馬、Waymo、百度坐在牌桌上。
至于終極成本,規(guī)模足夠大之后,硬件成本可以降到足夠低,但 Robotaxi 還有基本的車的成本以及運(yùn)營(yíng)費(fèi)用和電費(fèi)、油費(fèi)。最后的狀態(tài)是硬件成本降的很低,運(yùn)營(yíng)和車錢才是基礎(chǔ)費(fèi)用。
汽車之心:去年上半年你們的車隊(duì)運(yùn)營(yíng)成本占一大半,為什么運(yùn)營(yíng)成本會(huì)這么高?
樓天城:運(yùn)營(yíng)有兩種,一種是為了乘客的運(yùn)營(yíng),另一種是研發(fā)的運(yùn)營(yíng),運(yùn)營(yíng)成本比較高是因?yàn)橐С盅邪l(fā),才會(huì)造成財(cái)報(bào)運(yùn)營(yíng)看起來(lái)金額比較高。目前乘客運(yùn)營(yíng)主要包括了網(wǎng)費(fèi)、保險(xiǎn)、車輛維護(hù)、客服。
單從乘客運(yùn)營(yíng)成本來(lái)說(shuō),流程要變得更自動(dòng)化。比如車輛前面的路堵上了,車輛要跨實(shí)線掉頭或者換條路,需要人確認(rèn)。我們還要進(jìn)一步增加人車比。
運(yùn)營(yíng)成本還不能透露,但只要規(guī)模到上千臺(tái),就已經(jīng)從 struggle 的位置進(jìn)入到甜點(diǎn)區(qū)了。我們現(xiàn)在有三款無(wú)人車,加起來(lái)快到千臺(tái)規(guī)模了,已經(jīng)走出了 struggle 的狀態(tài)。
汽車之心:千臺(tái)就能告別 struggle?
樓天城:以 1000 輛為分水嶺有兩個(gè)前提條件,第一是要真無(wú)人,第二是要單車毛利轉(zhuǎn)正。這兩個(gè)前提做到之后,達(dá)到 1000 輛之后,隨著硬件成本下降再加上合理的運(yùn)營(yíng)區(qū)域,Robotaxi 就會(huì)走上正軌。
但具體一點(diǎn),1000 輛這個(gè)規(guī)模節(jié)點(diǎn)也對(duì)外傳遞信息的一種簡(jiǎn)化的數(shù)據(jù),我想表達(dá)的是百輛和千輛還是不一樣。
百臺(tái)的時(shí)候我可以用手慢慢敲,要到千臺(tái)不能用手敲,要有一套標(biāo)準(zhǔn)化自動(dòng)化的生產(chǎn)流程,所有的零件都要用車規(guī)級(jí)。這些都是需要時(shí)間的,到了千輛不確定性就變低了。商業(yè)化這件事需要時(shí)間,但沒(méi)有不確定性。
汽車之心:你覺得特斯拉、小馬、百度、Waymo 四家公司在商業(yè)化的優(yōu)勢(shì)分別是什么?
樓天城:在成本上,我覺得我們做的是最好,現(xiàn)在第七代 Robotaxi 全部使用全車規(guī)零件?,F(xiàn)在 Waymo 車上的 Lidar 和域控應(yīng)該都不是車規(guī)級(jí)的部件,特斯拉以前沒(méi)上牌桌,現(xiàn)在也沒(méi)有。
03、世界模型至少能解決 L4 的問(wèn)題
汽車之心:你們是少有的只做 L4 的公司,為什么不 L4 和 L2 一起做?
樓天城:不管是 L2 或者 L4,我們都要做好的產(chǎn)品,其實(shí)很多人不知道 Waymo 早年前就是做 L2 的,后來(lái)才做 L4。
但如果做 L2 系統(tǒng)無(wú)論你怎么宣傳,一定會(huì)有一部分用戶把它當(dāng)成 L4 去開。
那么我們是不是要捫心自問(wèn)一下,追求技術(shù)的公司是不是應(yīng)該保護(hù)這類用戶的安全。既然已經(jīng)意識(shí)到了,我不可能不管不顧,因此我必須要做 L4。我不接受當(dāng)鴕鳥。
汽車之心:L4 這條路難走嗎?
樓天城:難。根本上大多數(shù)人沒(méi)辦法接受計(jì)算機(jī)可以比人開得更好。最開始技術(shù)進(jìn)展很順利,系統(tǒng)表現(xiàn)越來(lái)越接近人,結(jié)果等到我們把能超越人的東西放出去,就相當(dāng)于放棄過(guò)去以學(xué)習(xí)人類為主的訓(xùn)練方式。
汽車之心:你說(shuō)的超越人指什么方面?
樓天城:舉個(gè)例子,比如 Robotaxi 的出險(xiǎn)率大概是人類的二三十分之一,安全性更高,事故率更低。
汽車之心:這個(gè)角度來(lái)看,你們會(huì)有痛苦,尤其是 L2、L4 都做的公司,驅(qū)動(dòng)力有一部分外部車企客戶,但只做 L4,內(nèi)驅(qū)會(huì)不會(huì)更難?
樓天城:我覺得你說(shuō)到關(guān)鍵點(diǎn)了。因?yàn)槭澜缒P痛罱ㄐ枰荛L(zhǎng)的時(shí)間,它有很長(zhǎng)的平臺(tái)期。
在平臺(tái)期壓力是巨大的,因?yàn)槠脚_(tái)期等于很難對(duì)外展示進(jìn)展。你今天來(lái)坐我們車和兩年后來(lái)坐我們車可能是一個(gè)樣子,技術(shù)一旦進(jìn)入平臺(tái)期,就需要非常多的堅(jiān)持和真正的信念才能走下去。
很多家死掉都是因?yàn)閳?jiān)持不住,這個(gè)很正常。但內(nèi)部可以制定很多指標(biāo),可以感受到我們的變化是非常明顯的,但外部感受不到。
汽車之心:你也痛苦過(guò)?
樓天城:我真不想再走一遍了,但是好在 2020 年開始的那四五年時(shí)間里,心態(tài)和進(jìn)展相對(duì)緩,給了我一個(gè)在平臺(tái)期的 breathing room。
不知道大家有沒(méi)有在互聯(lián)網(wǎng)大廠干過(guò),大公司下場(chǎng)干 Robotaxi 有沒(méi)有優(yōu)勢(shì)?我覺得不一定。
大公司基本上每 3 個(gè)月就要給上面的領(lǐng)導(dǎo)匯報(bào)一次。
那么比如在技術(shù)平臺(tái)期,第一次我匯報(bào)了,那第二次、第三次我匯報(bào)什么呢?其次每一次都?jí)毫薮?,我又不能跟上?jí)說(shuō)三個(gè)月都沒(méi)進(jìn)展,這樣的壓力會(huì)把人壓變形,很容易就會(huì)導(dǎo)致「要不然咱們做點(diǎn)短期的事算了。」
汽車之心:我們可以回來(lái)聊聊具體的技術(shù),小馬提出了世界模型,其實(shí)最近很多車企也提出世界基座大模型,你怎么看?
樓天城:聽起來(lái)他們做的事情跟小馬做的世界模型概念很相似。但我想說(shuō),小馬、蘿卜快跑、Waymo 大家所遇到的困難,這些車企也沒(méi)辦法跳過(guò)。就算有一天這些車企說(shuō)要造 Robotaxi 我也不驚訝,但從屬性上說(shuō),我更在意科技公司入局。
特斯拉算是一家具備科技屬性的車企,因?yàn)槭澜缒P偷拇罱芰χ饕褪悄P湍芰?、算力都是科技公司更擅長(zhǎng)的部分,不過(guò)就算是科技公司,也需要花很久的時(shí)間才能做出 Robotaxi。
汽車之心:他們的世界模型和小馬智行的世界模型有什么不一樣?
樓天城:我在五年前做的也叫世界模型,但我五年間一直在改進(jìn)世界模型。趕不上的是時(shí)間,說(shuō)得更具體一點(diǎn),衡量開車好不好很難量化,真正好的駕駛是「可以被人類理解的駕駛行為」,不會(huì)讓人奇怪它為什么這么做。
體驗(yàn)和安全性都很重要,對(duì)于極端場(chǎng)景的生成能力是世界模型很大的亮點(diǎn)。
我舉個(gè)例子,今天路上會(huì)有很多意想不到的異物。比如水管、鐵鍬、氣球,不同障礙物有不同的屬性,世界模型不僅需要意識(shí)到這些東西的存在,還要意識(shí)到障礙物具體的屬性找出相應(yīng)的應(yīng)對(duì)方式,這些東西可能在 L2 中還沒(méi)有被提及。
具體一些,路上有紙箱,但這個(gè)紙箱可能有好幾種情況:
第一種是紙箱會(huì)被吹飛,這時(shí)候如果紙箱正在被風(fēng)吹飛,車輛剎車后果會(huì)更嚴(yán)重,車應(yīng)該直接開過(guò)去。第二種可能是紙箱比較小,可以直接過(guò)去,第三種可能是紙箱比較大,那就要考慮繞過(guò)去,第四種可能紙箱里還會(huì)有硬物,那就不能隨便壓。
世界模型需要在極短的時(shí)間內(nèi)區(qū)分物體究竟屬于哪一類,再做出不同的行為,但本質(zhì)上世界模型需要意識(shí)到現(xiàn)實(shí)里的障礙物其實(shí)有很多種類,我們已經(jīng)有了這套方法,其他人要做到,還需要很久。
有一個(gè)詞叫「活久見」活得越久,見的就越多,世界模型就是一個(gè)活久見的東西,很多人不會(huì)想到的東西,它可以想到。今天這個(gè)事已經(jīng)很好理解了,其實(shí)訓(xùn)練世界模型不需要依賴駕駛數(shù)據(jù),因?yàn)榫W(wǎng)絡(luò)上數(shù)據(jù)也可以幫助世界模型訓(xùn)練。
像特斯拉 FSD 進(jìn)入中國(guó)其實(shí)也是用了網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練,特斯拉除了沒(méi)上牌桌之外,其他的邏輯和思路都挺對(duì)的。
汽車之心:聽起來(lái)世界模型就像一個(gè)巨大的工廠,那原材料數(shù)據(jù)呢,有了世界模型之后,我們需要還需要大量的真實(shí)駕駛數(shù)據(jù)嗎?余凱說(shuō) 99% 的司機(jī)都不值得學(xué),你說(shuō) 1% 的人類優(yōu)質(zhì)的司機(jī)對(duì) L4 沒(méi)用,這矛盾嗎?
樓天城:凱哥說(shuō)得是對(duì)的,我說(shuō)的那句話是 1% 的優(yōu)質(zhì)司機(jī)對(duì) L4 可能沒(méi)用,但對(duì) L2 有用。對(duì) L4 來(lái)說(shuō)學(xué)那 1% 的數(shù)據(jù)可能也不行,因?yàn)槟?1% 的司機(jī)利用了很多超視距信息,系統(tǒng)學(xué)不了。
在 L4 里,真實(shí)數(shù)據(jù)就像是種子,占比非常少,實(shí)際數(shù)據(jù)我沒(méi)辦法給,但它的占比大概是 1/ 1,000—1/ 100,000 的范圍。
所以我們的確需要大量數(shù)據(jù)來(lái)訓(xùn)練世界模型,但不是真實(shí)駕駛數(shù)據(jù),而是環(huán)境、生活數(shù)據(jù)。比如籃球是可以彈的,這件事跟開車沒(méi)有關(guān)系,但可以幫助世界模型去理解世界。
汽車之心:世界模式就是 L4 的終極路線嗎?
樓天城:世界模型足以支撐 Robotaxi 至少萬(wàn)臺(tái)以上的商業(yè)化。但之后會(huì)不會(huì)有更好的東西,我絕不會(huì)說(shuō)沒(méi)有,但我現(xiàn)在還沒(méi)想到。
也許是第 4 級(jí) AI,我認(rèn)為 AI 的發(fā)展方式分四個(gè)級(jí)別:co-pilot 是第二級(jí) AI,agent 是第三級(jí) AI,還有第四級(jí) AI,能夠自主創(chuàng)新的 AI,最后一級(jí)最可怕。
DeepSeek 只是第二級(jí) AI,機(jī)器人是第三級(jí) AI,第四級(jí) AI 會(huì)做一些人類可能還沒(méi)有想到的東西和方法,它會(huì)自己會(huì)嘗試新的方法去達(dá)成目的,開始自我發(fā)明,這也許是世界模型之后的下一個(gè)技術(shù)趨勢(shì)。
汽車之心:今年還有 VLA 這種技術(shù)路線很火熱,VLA 和世界模型這兩個(gè)技術(shù)方案有沖突嗎?
樓天城:沒(méi)有沖突,我了解大部分公司兩種技術(shù)都用。
比如 Waymo 也用了谷歌 Gemini 大語(yǔ)言模型。具體怎么用,序列事件模型不是模型,而是訓(xùn)練工具,它訓(xùn)練出模型本身,這個(gè)模型的輸入可以是 Vision、也可以是除它之外的 Action、Language。
所以世界模型和 VLA 模型不是一個(gè)維度的東西,而是交錯(cuò)的。我可以有訓(xùn)練,比如說(shuō)基于各種復(fù)雜輸入的事件模型的理念,所以這兩個(gè)東西不矛盾、不沖突,機(jī)器人領(lǐng)域非常多。
VLA 的作用主要是兩方面,一方面是降本,另一方面對(duì)特別復(fù)雜的情況能夠提供比較 OK 的建議。
比如,我們也引入了 VLA 模型遠(yuǎn)程給建議,早年我們一個(gè)遠(yuǎn)程協(xié)助專員(客服)管一個(gè)車,但是我們現(xiàn)在人車比做到 1:20。比如路口紅綠燈壞了,交警做了可以直行的手勢(shì),那么原本需要人工介入的車輛其實(shí)就能自己行動(dòng)了。
我認(rèn)為想要做百輛無(wú)人車以上,世界模型最關(guān)鍵,對(duì)其他公司,可能做 VLA 模型賣車最關(guān)鍵。大家選擇不同的路線是因?yàn)槟繕?biāo)不同。
汽車之心:人車比 1:20 算是什么水平?
樓天城:全球公開說(shuō)過(guò)自家人車比大于 1:1 的公司已經(jīng)是少數(shù)了,特斯拉在奧斯汀的人車比是 1:1,優(yōu)秀的 Robotaxi 公司平均水平至少在 1:10 以上。
汽車之心:最早衡量 Robotaxi 行業(yè)的時(shí)候,你和彭軍聊的是三個(gè)關(guān)鍵詞是:「MPD 值、數(shù)據(jù)量、成本」,現(xiàn)在你覺得這三個(gè)詞還能評(píng)估衡量 Robotaxi 嗎?
樓天城:這三個(gè)有一個(gè)沒(méi)了,有兩個(gè)升級(jí)了。
首先 MPD 已經(jīng)消失了。我做久了就知道 MPD 其實(shí)表示的不是安全,至于安全感怎么衡量,就要看更深入的評(píng)價(jià)體系了,安全和安全感不是一個(gè)東西。
成本仍然在,但是成本升級(jí)了,我們看的是保證安全感之下的成本。
最后一個(gè)數(shù)據(jù)量也在,但現(xiàn)在的數(shù)據(jù)指的是仿真數(shù)據(jù)。billion 級(jí)數(shù)據(jù)量對(duì)于仿真數(shù)據(jù)來(lái)說(shuō)都已經(jīng)算太少了,我們的世界模型每周都會(huì)產(chǎn)生 10 個(gè) billion 級(jí)以上的數(shù)據(jù)。
其實(shí)仿真世界的真實(shí)度并不一定比真實(shí)世界差。如果我站在做 L2 的系統(tǒng)的角度,模仿學(xué)習(xí)確實(shí)很需要真實(shí)數(shù)據(jù),但面向 L4 我們更看重仿真數(shù)據(jù)。
來(lái)源:第一電動(dòng)網(wǎng)
作者:汽車之心
本文地址:http://ewshbmdt.cn/kol/270949
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。