Robotaxi 這個行業(yè)就像一顆網(wǎng)球落在地上,反復上下彈跳,一直在等待有人發(fā)出最有力的一擊揮拍,把球擊過欄網(wǎng)。
一年前看起來是這顆網(wǎng)球彈跳的最高點,Robotaxi 從武漢火到了全國,許多人開始好奇坐無人出租車是一種什么體驗。
一年后 Robotaxi 又來到了小高峰期,馬斯克不再跳票,準時于 6 月 22 號在美國奧斯汀運營特斯拉 Robotaxi。天降大任于斯人也,很多人寄希望于馬斯克,希望這個如神般的人物能帶領特斯拉率先在奧斯汀完成盈利。
但 Robotaxi 行業(yè)還沒有因為特斯拉加入就加速,特斯拉目前也沒有因為進入 Robotaxi 行業(yè),就跳過其中任何一步。
特斯拉的 Robotaxi 仍然必須從一個城市、幾條固定線路、10-20 臺車、邀請制開始試運營,然后再逐步擴大到其他區(qū)域。
有些人瘋狂吹噓 Robotaxi,因為這可能企業(yè)市值的下一個增長點。有些人出于對自動駕駛的技術自信啟程,卻被繁雜的商業(yè)化運營束縛住手腳。
如果把這兩種人都從 Robotaxi 的道路上驅(qū)逐出去,這條道路就顯然會空曠很多。
當我們談論 Robotaxi 時,至少應該談論一些只做無人駕駛技術的公司,樓天城是其中一個,他的公司小馬智行去年以「Robotaxi 第一股」在納斯達克上市,他和另一位創(chuàng)始人彭軍一起敲了鐘,現(xiàn)在小馬智行美股市值接近 400 億人民幣。
但上市顯然也不是這顆網(wǎng)球被擊出越網(wǎng)的一瞬間。
外界對 Robotaxi 還存在著太多困惑,樓天城感嘆「其實人對于看到比自己車技更好的電腦,第一反應是不接受的?!?/p>
我們和樓天城聊了兩次,一次發(fā)生在上海車展期間,他們剛剛發(fā)布第七代 Robotaxi,一次發(fā)生在特斯拉開啟試運營的兩天前,樓天城也申請了特斯拉 Robotaxi 的試乘,但沒有被通過。
通過兩次聊天,我發(fā)現(xiàn)他和我想象中一樣在乎一臺 Robotaxi 的成本,但他抱怨很多人沒弄明白真正的成本在哪,在無人車上討論去掉最多占成本 10% 的激光雷達、1% 的高精地圖,就像在西瓜瓤里面挑籽。
但是他卻沒有想象中那么在乎特斯拉的入局,在他眼里,即便特斯拉開啟試運營,但依舊還沒上 Robotaxi 的牌桌。他認為小馬走過的路,這些公司一步都不會少走。
差別在于時間。從 2021 年小馬發(fā)布第一代全無人車型起,到今年小馬把 Robotaxi 運營規(guī)模拓展到接近上千輛,用了 4 年時間。
Robotaxi 遠非大多數(shù)人想象中大火烹油、聲勢浩大,更接近于熬糖漿,把白砂糖倒進去,加水倒進去慢慢熬,但凡水多一點、少一點,火大一點、小一點,都不是那種最完美的琥珀色。
「熬」聽起來很掙扎,在小馬只有不到一百臺車的時候,他擔心第 101 輛的時候還需要用手敲,當世界模型這個技術解法被找到時,樓天城找回了那種信心。
有趣的是,世界模型解決 L4 自動駕駛的本質(zhì)就是「活久見」,活得越久,看到的東西越多,會得就越多。
解法也在于時間。
「Robotaxi 商業(yè)化漫長的等待時間已經(jīng)過去了,我們已經(jīng)不再 struggle 了」。樓天城如是說。
01、漫長的等待已經(jīng)過去了
汽車之心:去年武漢關注潮之后,Robotaxi 好像又不火了。如果不實現(xiàn)真正的商業(yè)化,這個行業(yè)就沒有真正意義上的關注度?
樓天城:這個行業(yè)沒有得到大眾真正的關注,在于服務還不夠好。
不光是自動駕駛,AI 吸引人的方式一直都是依靠好用。
Deepseek 你覺得他是因為什么吸引人?其實是它好用。AI 真正被人認可,只會因為它有高質(zhì)量的服務,剛開始創(chuàng)業(yè)的時候我就這么想的,現(xiàn)在我還這么想。
汽車之心:你說過特斯拉還沒上牌桌,那你怎么看特斯拉在奧斯汀開啟無人化運營?
樓天城:今天我也這么認為,強如馬斯克,在 Robotaxi 上也得一步一步來。
2015 年 Waymo 也在奧斯汀第一次做無人化展示??梢韵胍幌肟礊槭裁创蠹叶荚谕粋€地方?
是因為奧斯汀是道路相對可控的沙漠區(qū)域。去年馬斯克推遲了 2 個月開了 Robotaxi 發(fā)布會,一年過去他才在奧斯汀又放了 10-20 輛車,以及奧斯汀的部分區(qū)域運營。
這種分階段的做法其實就是 Robotaxi 發(fā)展的方向,即便是特斯拉,也需要從 1 到 10 往前走,下一步特斯拉可能會提升車速、覆蓋整個奧斯汀,從只有 10 輛車再到讓更多人打到車。
上周我在美國,也申請了幾次體驗特斯拉 robotaxi,但都沒通過。
汽車之心:你提到了規(guī)模,Robotaxi 規(guī)模從 1 到 10,從 10 到 100,從 100 到 1000 輛,不同的車隊規(guī)模會經(jīng)歷哪些難點?
樓天城:從 1 到 10 輛是邀請制,一切是可控的。坐哪輛車、線路、運營區(qū)域都是固定的,我們最早在廣州南沙坐無人車 Demo 的時候路線也是自己定的,選的是狀態(tài)最好的車運行。
從 10 到 100 輛的階段已經(jīng)在靠千輛的方式運行,區(qū)別是 10 到 100 的階段不會再去控制路線和場景。今天能做到 10 到 100 的公司已經(jīng)非常少,特斯拉也沒有做到,根本原因是大家的車沒有處理區(qū)域內(nèi)所有場景的能力。
只有規(guī)模做到上百臺,才勉強叫「上了 Robotaxi 牌桌」。
從 100 到 1000 輛的難點跟從 10 到 100 的差別在于降低成本的前提下,做出和原來一樣的效果。
用金子一樣做出的東西,當然很好用。比如原來激光雷達十幾萬一個,現(xiàn)在每年都在更新,價格降到了幾百塊。但從十幾萬降到幾百塊,也逃不過「一分錢一分貨」,幾百的東西比十幾萬的信噪比可能高出了 30 倍,那我們就必須要用軟件提升 Network,吃掉這 30 倍的信噪比。
而從 1000 到 10000 輛,難度就沒那么大了,因為 L4 泛化能力很強,但擴展到更多城市,會對基礎設施要求更多一些。
所以,最難的是從 10 到 100 輛、從 100 到 1000 輛這兩步。
汽車之心:小馬智行單臺 Robotaxi 日均訂單量 15 單,這個數(shù)字是什么水平?
樓天城:每輛車日均 15 單已經(jīng)是符合 Robotaxi 正常需要、比較成熟的數(shù)字了,如果有人能把這個數(shù)字提上去很多,才會讓我驚訝。
但是車輛規(guī)模和等待時間是有很多空間的。
規(guī)模增加對整體單量有很大幫助。如果規(guī)模太小,每一次車輛接單距離就會變長,車輛稀疏會造成用戶等待時間就會變長,最終也會變成體驗問題。
現(xiàn)階段車輛規(guī)模增加有助于提升體驗,我不是說具體車輛數(shù)量漲到多少,而是當下階段,提升規(guī)模是可以增加單量,今年我們會進入千臺規(guī)模。
汽車之心:小馬智行有三大塊業(yè)務 Robotaxi、Robotruck 和技術授權,但 Robotaxi 對小馬營收的貢獻 2024 年上半年只有 4.7%,且呈下降趨勢,這是為什么?
樓天城:財報里的營收要分開看,一個是狹義的 Robotaxi 營收,就是車輛在外面接單,乘客付錢的盈利。另一個是廣義的營收,比如我們還有項目之外的合作,車輛轉(zhuǎn)賣給其他方,有一次性的項目收入在里面,有項目周期的緣故,才會給大家營收下降的感覺。
現(xiàn)在因為我們是上市公司,我不能分享具體數(shù)字,但我單純看 Robotaxi 的數(shù)字,我可以說增長非常多。
汽車之心:那你有沒有想過這三類業(yè)務,什么樣的業(yè)務貢獻比例是理想狀態(tài)?
樓天城:Robotaxi 占到九成甚至更多才是我們的理想狀態(tài)。但 Robotruck 單量增長后,會如何和 Robotaxi 分比,這會是一個很有意思的問題。
汽車之心:你們當初為什么要做 Robotruck,跟 Robotaxi 相比哪個業(yè)務會更快毛利轉(zhuǎn)正?
樓天城:我們當初會做 Robotruck,并不代表是它會比 Robotaxi 先盈利,而是因為它是唯一能在自動駕駛程度上能和 Robotaxi 比較的市場。
這里還有個聽起來很反直覺的東西,本質(zhì)上 Robotruck 比 Robotaxi 更難做到無人。
事實上現(xiàn)在世界上還沒有任何一輛 Robotruck 在公開道路上無人常態(tài)化運營。原因很好理解,第一,卡車出事故的后果更嚴重,對安全性要求非常高,整個開發(fā)驗證過程都需要更長時間。
第二,卡車的場景簡單,技術更好實現(xiàn),這是嚴重的思維誤區(qū)。因為簡不簡單都要達到超過人的水平,所以簡單不一定是好事,就比如你希望在班里考第一名、第二名,這跟題目簡不簡單沒有關系,簡單你也需要考這個成績。
汽車之心:為什么你們 Q1 財報還處于增收不增利的狀態(tài)?
樓天城:我認為我們的財報狀態(tài)符合這個階段表現(xiàn)出的認知,整個行業(yè)都需要更長時間積累才能到下一個階段。
汽車之心:你們現(xiàn)在做無人車域控給美團,接下來會不會下場做低速無人車?
樓天城:我們有信心能做無人小車,但是 Robotaxi 和無人小車的市場價值天差地別。
Elon Musk 說過 Robotaxi 是八萬億美元的市場,無人小車不會比這個市場更大,兩者之間跟不說差 2 個 0,差一個 0 是肯定有的,所以我何必去聚焦一個價值只有 1/10 的東西呢?
我有能力、有信心去做價值更高的事情,我就會聚焦在 Robotaxi 上,我不會因為設置了高目標,做不到之后,先去做其他東西。我還是希望大家奔著真正有價值的事情去做。
汽車之心:聽起來有點樂觀,Robotaxi 的商業(yè)化很漫長。
樓天城:這種漫長等待的時間已經(jīng)過去了。我對 Robotaxi 的信心不是今天才有的。
02、大多數(shù)人談降本,卻沒搞對成本在哪
汽車之心:小馬的策略是更優(yōu)的成本結構下擴規(guī)模,什么樣的成本結構算優(yōu)質(zhì)?以及把單車成本做到不虧錢,這個要分幾步做才能不虧?
樓天城:成本和規(guī)模是相關的。降本是關鍵,真正做的人會明白問題的關鍵是「成本主要在哪?」但降本不在于用不用激光雷達、高精地圖,他們都不是成本的關鍵因素。大家在說降本的時候,根本沒有搞對成本是什么。
第一個關鍵因素是,一定要先做到無人。
第二個因素是車規(guī)零部件。Robotaxi 之前還有很多非車規(guī)件,比如小馬智行第五代無人車頭頂有一顆旋轉(zhuǎn)的機械激光雷達,車上有這個東西就沒有計算成本的必要了。早年間,我們買的第一個機械激光雷達 85 萬人民幣,但現(xiàn)在固態(tài)激光雷達的成本明顯下降,都是以千元計算。
現(xiàn)在要解決的是,能不能在用性價比高的核心零部件的時候,還保障性能水平不下降。
第三個因素跟運營相關。現(xiàn)在我們還有遠程協(xié)助專員,比如車輛擁堵的時候會有一些詢問。之后降本的關鍵也在考驗能不能把運營流程變得足夠智能,一個人就能管五十輛車。
第四個因素就是保費,每一年給 Robotaxi 上保也是一筆很大的錢。
算完這些,今天在我們的無人車里,激光雷達能占到成本 10% 已經(jīng)很不錯了,我犯不著天天為 10% 糾結,而高精地圖可能 1% 成本都占不到。
在這些之外,有一個非常反直覺的大頭成本——其實是網(wǎng)費。
很多車企依靠路網(wǎng)收集數(shù)據(jù)來幫助訓練,這是個悖論,因為如果這么多數(shù)據(jù),網(wǎng)費會爆炸。邏輯是:你愿意為收集數(shù)據(jù),付多少網(wǎng)費,而不是你有多少車,收集多少數(shù)據(jù)。
今天 Robotaxi 不太存在接管,可能因為方向打得太急這種情況才要收集數(shù)據(jù),即便如此,網(wǎng)費依然占了我們成本的大頭。如果經(jīng)常接管,網(wǎng)費占比極高,一輛車要付九倍錢去收集數(shù)據(jù)。
L4 去激光雷達是研究院做的事,從商業(yè)化來說,這些對 Robotaxi 企業(yè)不重要,萬一去了激光雷達,我卻加了倆芯片,還不知道是虧了還是賺了。
第五個因素是隱形的原子化優(yōu)化。
比如把我們的模型縮小到原來 1/ 3,就只需要 1/ 3 的算力來做了。
大家過去有一個誤解,覺得算力越高越厲害,但那是從科研探索角度來說的,從成本來說,肯定是模型壓得越小,用更小算力實現(xiàn)整個計算要求,還能降本,這樣的思路才是有利于發(fā)展的。比如原來我買 3 塊 BPU,現(xiàn)在就只買一塊了,這就省下了 2/3 的錢。
汽車之心:你剛剛提到網(wǎng)費,那么 Robotaxi 公司進入海外市場可能會遇到很多網(wǎng)絡不好的地方,那么網(wǎng)絡對自動駕駛出海會不會是一個巨大的問題?
樓天城:網(wǎng)絡就算不出海也是一個巨大的問題。我以前也做過網(wǎng)絡,車本身只能接受百毫秒級別的網(wǎng)絡延遲,中國就算有 5G 其實支撐度也非常差。
所以我們很早就意識到 L4 要靠車自己而不能靠網(wǎng)絡,網(wǎng)絡只是輔助給系統(tǒng)一些建議。所以我們的車網(wǎng)絡斷了駕駛也不會有任何問題。
汽車之心:怎么去保證斷網(wǎng)系統(tǒng)也不出問題?
樓天城:簡單說就是車端具有自動駕駛模型能力,或者說我需要最終在意的是我在車端的那個模型要足夠強,而不是我在云端足夠強。
汽車之心:馬斯克之前說 Robotaxi 的成本能降到每英里 0.2 美元,這是 Robotaxi 的終極成本嗎?
樓天城:特斯拉還沒有上桌,Robotaxi 的牌桌是做到無人商業(yè)化的運營,且要做到一定規(guī)模的。今天只有小馬、Waymo、百度坐在牌桌上。
至于終極成本,規(guī)模足夠大之后,硬件成本可以降到足夠低,但 Robotaxi 還有基本的車的成本以及運營費用和電費、油費。最后的狀態(tài)是硬件成本降的很低,運營和車錢才是基礎費用。
汽車之心:去年上半年你們的車隊運營成本占一大半,為什么運營成本會這么高?
樓天城:運營有兩種,一種是為了乘客的運營,另一種是研發(fā)的運營,運營成本比較高是因為要支持研發(fā),才會造成財報運營看起來金額比較高。目前乘客運營主要包括了網(wǎng)費、保險、車輛維護、客服。
單從乘客運營成本來說,流程要變得更自動化。比如車輛前面的路堵上了,車輛要跨實線掉頭或者換條路,需要人確認。我們還要進一步增加人車比。
運營成本還不能透露,但只要規(guī)模到上千臺,就已經(jīng)從 struggle 的位置進入到甜點區(qū)了。我們現(xiàn)在有三款無人車,加起來快到千臺規(guī)模了,已經(jīng)走出了 struggle 的狀態(tài)。
汽車之心:千臺就能告別 struggle?
樓天城:以 1000 輛為分水嶺有兩個前提條件,第一是要真無人,第二是要單車毛利轉(zhuǎn)正。這兩個前提做到之后,達到 1000 輛之后,隨著硬件成本下降再加上合理的運營區(qū)域,Robotaxi 就會走上正軌。
但具體一點,1000 輛這個規(guī)模節(jié)點也對外傳遞信息的一種簡化的數(shù)據(jù),我想表達的是百輛和千輛還是不一樣。
百臺的時候我可以用手慢慢敲,要到千臺不能用手敲,要有一套標準化自動化的生產(chǎn)流程,所有的零件都要用車規(guī)級。這些都是需要時間的,到了千輛不確定性就變低了。商業(yè)化這件事需要時間,但沒有不確定性。
汽車之心:你覺得特斯拉、小馬、百度、Waymo 四家公司在商業(yè)化的優(yōu)勢分別是什么?
樓天城:在成本上,我覺得我們做的是最好,現(xiàn)在第七代 Robotaxi 全部使用全車規(guī)零件?,F(xiàn)在 Waymo 車上的 Lidar 和域控應該都不是車規(guī)級的部件,特斯拉以前沒上牌桌,現(xiàn)在也沒有。
03、世界模型至少能解決 L4 的問題
汽車之心:你們是少有的只做 L4 的公司,為什么不 L4 和 L2 一起做?
樓天城:不管是 L2 或者 L4,我們都要做好的產(chǎn)品,其實很多人不知道 Waymo 早年前就是做 L2 的,后來才做 L4。
但如果做 L2 系統(tǒng)無論你怎么宣傳,一定會有一部分用戶把它當成 L4 去開。
那么我們是不是要捫心自問一下,追求技術的公司是不是應該保護這類用戶的安全。既然已經(jīng)意識到了,我不可能不管不顧,因此我必須要做 L4。我不接受當鴕鳥。
汽車之心:L4 這條路難走嗎?
樓天城:難。根本上大多數(shù)人沒辦法接受計算機可以比人開得更好。最開始技術進展很順利,系統(tǒng)表現(xiàn)越來越接近人,結果等到我們把能超越人的東西放出去,就相當于放棄過去以學習人類為主的訓練方式。
汽車之心:你說的超越人指什么方面?
樓天城:舉個例子,比如 Robotaxi 的出險率大概是人類的二三十分之一,安全性更高,事故率更低。
汽車之心:這個角度來看,你們會有痛苦,尤其是 L2、L4 都做的公司,驅(qū)動力有一部分外部車企客戶,但只做 L4,內(nèi)驅(qū)會不會更難?
樓天城:我覺得你說到關鍵點了。因為世界模型搭建需要很長的時間,它有很長的平臺期。
在平臺期壓力是巨大的,因為平臺期等于很難對外展示進展。你今天來坐我們車和兩年后來坐我們車可能是一個樣子,技術一旦進入平臺期,就需要非常多的堅持和真正的信念才能走下去。
很多家死掉都是因為堅持不住,這個很正常。但內(nèi)部可以制定很多指標,可以感受到我們的變化是非常明顯的,但外部感受不到。
汽車之心:你也痛苦過?
樓天城:我真不想再走一遍了,但是好在 2020 年開始的那四五年時間里,心態(tài)和進展相對緩,給了我一個在平臺期的 breathing room。
不知道大家有沒有在互聯(lián)網(wǎng)大廠干過,大公司下場干 Robotaxi 有沒有優(yōu)勢?我覺得不一定。
大公司基本上每 3 個月就要給上面的領導匯報一次。
那么比如在技術平臺期,第一次我匯報了,那第二次、第三次我匯報什么呢?其次每一次都壓力巨大,我又不能跟上級說三個月都沒進展,這樣的壓力會把人壓變形,很容易就會導致「要不然咱們做點短期的事算了?!?/p>
汽車之心:我們可以回來聊聊具體的技術,小馬提出了世界模型,其實最近很多車企也提出世界基座大模型,你怎么看?
樓天城:聽起來他們做的事情跟小馬做的世界模型概念很相似。但我想說,小馬、蘿卜快跑、Waymo 大家所遇到的困難,這些車企也沒辦法跳過。就算有一天這些車企說要造 Robotaxi 我也不驚訝,但從屬性上說,我更在意科技公司入局。
特斯拉算是一家具備科技屬性的車企,因為世界模型的搭建能力主要就是模型能力、算力都是科技公司更擅長的部分,不過就算是科技公司,也需要花很久的時間才能做出 Robotaxi。
汽車之心:他們的世界模型和小馬智行的世界模型有什么不一樣?
樓天城:我在五年前做的也叫世界模型,但我五年間一直在改進世界模型。趕不上的是時間,說得更具體一點,衡量開車好不好很難量化,真正好的駕駛是「可以被人類理解的駕駛行為」,不會讓人奇怪它為什么這么做。
體驗和安全性都很重要,對于極端場景的生成能力是世界模型很大的亮點。
我舉個例子,今天路上會有很多意想不到的異物。比如水管、鐵鍬、氣球,不同障礙物有不同的屬性,世界模型不僅需要意識到這些東西的存在,還要意識到障礙物具體的屬性找出相應的應對方式,這些東西可能在 L2 中還沒有被提及。
具體一些,路上有紙箱,但這個紙箱可能有好幾種情況:
第一種是紙箱會被吹飛,這時候如果紙箱正在被風吹飛,車輛剎車后果會更嚴重,車應該直接開過去。第二種可能是紙箱比較小,可以直接過去,第三種可能是紙箱比較大,那就要考慮繞過去,第四種可能紙箱里還會有硬物,那就不能隨便壓。
世界模型需要在極短的時間內(nèi)區(qū)分物體究竟屬于哪一類,再做出不同的行為,但本質(zhì)上世界模型需要意識到現(xiàn)實里的障礙物其實有很多種類,我們已經(jīng)有了這套方法,其他人要做到,還需要很久。
有一個詞叫「活久見」活得越久,見的就越多,世界模型就是一個活久見的東西,很多人不會想到的東西,它可以想到。今天這個事已經(jīng)很好理解了,其實訓練世界模型不需要依賴駕駛數(shù)據(jù),因為網(wǎng)絡上數(shù)據(jù)也可以幫助世界模型訓練。
像特斯拉 FSD 進入中國其實也是用了網(wǎng)絡數(shù)據(jù)訓練,特斯拉除了沒上牌桌之外,其他的邏輯和思路都挺對的。
汽車之心:聽起來世界模型就像一個巨大的工廠,那原材料數(shù)據(jù)呢,有了世界模型之后,我們需要還需要大量的真實駕駛數(shù)據(jù)嗎?余凱說 99% 的司機都不值得學,你說 1% 的人類優(yōu)質(zhì)的司機對 L4 沒用,這矛盾嗎?
樓天城:凱哥說得是對的,我說的那句話是 1% 的優(yōu)質(zhì)司機對 L4 可能沒用,但對 L2 有用。對 L4 來說學那 1% 的數(shù)據(jù)可能也不行,因為那 1% 的司機利用了很多超視距信息,系統(tǒng)學不了。
在 L4 里,真實數(shù)據(jù)就像是種子,占比非常少,實際數(shù)據(jù)我沒辦法給,但它的占比大概是 1/ 1,000—1/ 100,000 的范圍。
所以我們的確需要大量數(shù)據(jù)來訓練世界模型,但不是真實駕駛數(shù)據(jù),而是環(huán)境、生活數(shù)據(jù)。比如籃球是可以彈的,這件事跟開車沒有關系,但可以幫助世界模型去理解世界。
汽車之心:世界模式就是 L4 的終極路線嗎?
樓天城:世界模型足以支撐 Robotaxi 至少萬臺以上的商業(yè)化。但之后會不會有更好的東西,我絕不會說沒有,但我現(xiàn)在還沒想到。
也許是第 4 級 AI,我認為 AI 的發(fā)展方式分四個級別:co-pilot 是第二級 AI,agent 是第三級 AI,還有第四級 AI,能夠自主創(chuàng)新的 AI,最后一級最可怕。
DeepSeek 只是第二級 AI,機器人是第三級 AI,第四級 AI 會做一些人類可能還沒有想到的東西和方法,它會自己會嘗試新的方法去達成目的,開始自我發(fā)明,這也許是世界模型之后的下一個技術趨勢。
汽車之心:今年還有 VLA 這種技術路線很火熱,VLA 和世界模型這兩個技術方案有沖突嗎?
樓天城:沒有沖突,我了解大部分公司兩種技術都用。
比如 Waymo 也用了谷歌 Gemini 大語言模型。具體怎么用,序列事件模型不是模型,而是訓練工具,它訓練出模型本身,這個模型的輸入可以是 Vision、也可以是除它之外的 Action、Language。
所以世界模型和 VLA 模型不是一個維度的東西,而是交錯的。我可以有訓練,比如說基于各種復雜輸入的事件模型的理念,所以這兩個東西不矛盾、不沖突,機器人領域非常多。
VLA 的作用主要是兩方面,一方面是降本,另一方面對特別復雜的情況能夠提供比較 OK 的建議。
比如,我們也引入了 VLA 模型遠程給建議,早年我們一個遠程協(xié)助專員(客服)管一個車,但是我們現(xiàn)在人車比做到 1:20。比如路口紅綠燈壞了,交警做了可以直行的手勢,那么原本需要人工介入的車輛其實就能自己行動了。
我認為想要做百輛無人車以上,世界模型最關鍵,對其他公司,可能做 VLA 模型賣車最關鍵。大家選擇不同的路線是因為目標不同。
汽車之心:人車比 1:20 算是什么水平?
樓天城:全球公開說過自家人車比大于 1:1 的公司已經(jīng)是少數(shù)了,特斯拉在奧斯汀的人車比是 1:1,優(yōu)秀的 Robotaxi 公司平均水平至少在 1:10 以上。
汽車之心:最早衡量 Robotaxi 行業(yè)的時候,你和彭軍聊的是三個關鍵詞是:「MPD 值、數(shù)據(jù)量、成本」,現(xiàn)在你覺得這三個詞還能評估衡量 Robotaxi 嗎?
樓天城:這三個有一個沒了,有兩個升級了。
首先 MPD 已經(jīng)消失了。我做久了就知道 MPD 其實表示的不是安全,至于安全感怎么衡量,就要看更深入的評價體系了,安全和安全感不是一個東西。
成本仍然在,但是成本升級了,我們看的是保證安全感之下的成本。
最后一個數(shù)據(jù)量也在,但現(xiàn)在的數(shù)據(jù)指的是仿真數(shù)據(jù)。billion 級數(shù)據(jù)量對于仿真數(shù)據(jù)來說都已經(jīng)算太少了,我們的世界模型每周都會產(chǎn)生 10 個 billion 級以上的數(shù)據(jù)。
其實仿真世界的真實度并不一定比真實世界差。如果我站在做 L2 的系統(tǒng)的角度,模仿學習確實很需要真實數(shù)據(jù),但面向 L4 我們更看重仿真數(shù)據(jù)。
來源:第一電動網(wǎng)
作者:汽車之心
本文地址:http://ewshbmdt.cn/kol/270949
文中圖片源自互聯(lián)網(wǎng),如有侵權請聯(lián)系admin#d1ev.com(#替換成@)刪除。