盡管在2025年上半年輔助駕駛行業(yè)經(jīng)歷了一番風(fēng)波,但到了下半年,在技術(shù)上頭部公司的輔助駕駛系統(tǒng)明顯地要開始邁入下一階段。
理想、小鵬、元戎這些玩家們都霍霍欲試,以VLA為代表基于新一代模型的輔助駕駛系統(tǒng)呼之欲出。
理想已經(jīng)在一季度的財(cái)報(bào)會(huì)上預(yù)告:7月理想將發(fā)布純電SUV i8,并同步推出基于VLA模型的輔助駕駛系統(tǒng)。i8將是理想繼MEGA之后在純電上的關(guān)鍵一戰(zhàn),理想的前期宣傳將不少的賣點(diǎn)都寄托在了新的輔助駕駛上。
小鵬也在6月11日剛剛揭幕了全新的G7,G7首發(fā)了自研的圖靈芯片,并且一次就搭載3顆,擁有超過(guò)2200 Tops的算力?;谶@個(gè)級(jí)別的算力,小鵬正在云端訓(xùn)練超大規(guī)模的VLA模型,稱之為VLA-OL(Online Reenforcement Learning);接下來(lái),小鵬將通過(guò)蒸餾的方式將VLA部署到車端。
除了新勢(shì)力自研的陣營(yíng),傳統(tǒng)廠商一側(cè)其對(duì)VLA技術(shù)也有強(qiáng)烈的興趣。供應(yīng)商中,元戎啟行可能是對(duì)VLA推進(jìn)得最早、最快的一家公司,其在去年6月份第一次對(duì)外公開談到在開發(fā)VLA,其預(yù)計(jì)今年將有至少5款車搭載元戎啟行提供的VLA模型上市,其中最早的車型預(yù)計(jì)在三季度量產(chǎn)并上線功能。
智能輔助駕駛已經(jīng)成為新車銷售中的關(guān)鍵配置,今年伴隨著英偉達(dá)DRIVE Thor等新一代芯片上車,整個(gè)行業(yè)正經(jīng)歷技術(shù)換代。
以VLA為代表的新模型能帶來(lái)什么樣的變化,這不僅是當(dāng)下時(shí)下汽車行業(yè)的開發(fā)者們翹首以待的,甚至有準(zhǔn)備購(gòu)車的車主都在密切關(guān)注——畢竟動(dòng)輒30萬(wàn)元級(jí)的購(gòu)車決策,誰(shuí)也不想剛買的新車在關(guān)鍵配置上很快落后。
關(guān)于新一代的VLA模型有什么功能,理想在今年3月份的GTC上已經(jīng)給了一些小小的劇透;而最近一周內(nèi),元戎啟行的CEO周光在火山引擎Force大會(huì)上披露了更多細(xì)節(jié)。元戎重點(diǎn)展示了基于VLA 4個(gè)主要的能力:
空間語(yǔ)義理解,尤其是由于遮擋造成的盲區(qū),這是一大類常見的問(wèn)題,比如橋洞通行時(shí)或者因?yàn)楣卉嚨却筌囋斐傻膭?dòng)靜態(tài)視野遮擋,VLA能夠理解這個(gè)語(yǔ)義,并且執(zhí)行更安全、有防御性的駕駛決策。
異形障礙物識(shí)別,典型的比如施工、異形車或者因?yàn)槌d而變形的車輛。
文字引導(dǎo)牌理解,比如轉(zhuǎn)彎待行區(qū)的文字指引、可變車道、潮汐車道等等。
語(yǔ)音控車,通過(guò)VLA模型,系統(tǒng)可以根據(jù)語(yǔ)音指令做出對(duì)應(yīng)的駕駛決策,并且當(dāng)用戶意愿與導(dǎo)航信息相沖突時(shí),VLA模型會(huì)優(yōu)先采納用戶意愿。
這些功能目前都已經(jīng)有demo展示,元戎還預(yù)告了接下來(lái)還會(huì)有新的功能陸續(xù)會(huì)上線,包括豪車識(shí)別功能以及在園區(qū)里找充電樁等。
其實(shí)在過(guò)去幾個(gè)月里,我們已經(jīng)初步體驗(yàn)了一些新一代的系統(tǒng),包括蔚來(lái)基于世界模型NWM的新版本,以及理想在新版AD Max(基于NVIDIA Drive Thor U平臺(tái))上部署的初代Agent能力。
其中最大的感受是新的模型對(duì)場(chǎng)景的認(rèn)知大幅提升,系統(tǒng)不再是執(zhí)行一個(gè)簡(jiǎn)單的「A點(diǎn)移動(dòng)到B點(diǎn)」的指令,而是會(huì)根據(jù)語(yǔ)音下達(dá)的需求,認(rèn)識(shí)、思考、執(zhí)行,從而提高增加輔助駕駛功能的便利性。比如在停車場(chǎng),能根據(jù)需要找到地庫(kù)的電梯口;能主動(dòng)理解掉頭的需求,并且找到合適的點(diǎn)位掉頭。
不過(guò)目前我們已經(jīng)體驗(yàn)過(guò)的demo都限于封閉地庫(kù)或者園區(qū)場(chǎng)景,元戎給出的新功能則更多針對(duì)開放場(chǎng)景,看起來(lái)組合更加豐富。
基于更大算力和先進(jìn)架構(gòu)的模型,顯然還會(huì)有更多的功能推出。在G7上懟了3顆圖靈芯片的小鵬也給了這個(gè)預(yù)期,「G7出來(lái)的時(shí)候,后面每個(gè)月都會(huì)增加新的有趣的功能,會(huì)有很多新的行業(yè)沒有的功能出來(lái),這是算力帶來(lái)的想象空間?!?/p>
在過(guò)去一年,幾乎所有主流的車企在輔助駕駛上都更新成了端到端大模型驅(qū)動(dòng)的系統(tǒng),在短時(shí)間內(nèi)性能和體驗(yàn)提升都比較明顯。但端到端黑盒的研發(fā)模式,導(dǎo)致了部分Corner Case無(wú)法追溯產(chǎn)生的原因,這也導(dǎo)致一部分車企很快地從「熱戀期」進(jìn)入到了「瓶頸期」。
即使是當(dāng)前TOP級(jí)別的端到端系統(tǒng),在面臨復(fù)雜道路結(jié)構(gòu)疊加復(fù)雜車流博弈時(shí)大多數(shù)情況也會(huì)崩潰。行業(yè)普遍面臨瓶頸,所以很自然地有公司開始探尋上限更高的新架構(gòu)。
而VLA通過(guò)語(yǔ)言模型的引入,很好地解決了研發(fā)和用戶兩端黑盒的問(wèn)題。
不過(guò),這并不意味著端到端不值得投入開發(fā)。李想本人在最近的AI Talk中就提到,他們內(nèi)部認(rèn)為:如果規(guī)則算法都做不好,根本不知道怎么去做端到端;如果端到端沒有做到一個(gè)非常極致的水平,那連VLA(視覺語(yǔ)言行動(dòng)模型)怎么去訓(xùn)練都不知道。換句話說(shuō),在端到端上取得大規(guī)模成功量產(chǎn)經(jīng)驗(yàn),是探索VLA的一個(gè)門檻。
小鵬是在國(guó)內(nèi)智能輔助駕駛最早的推動(dòng)者,而理想在2024年通過(guò)清晰的AI戰(zhàn)略大幅加速了其輔助駕駛的研發(fā),「E2E+VLM」的范式在去年掀起了一波不小的風(fēng)潮。元戎本身是一家有很強(qiáng)AI基因的公司,去年它在魏牌藍(lán)山和Smat精靈5上實(shí)現(xiàn)了端到端輔助駕駛方案的量產(chǎn),先進(jìn)性和工程能力受到頭部自主品牌的認(rèn)可。
接下來(lái),小鵬將在后續(xù)車型的Ultra版本(搭載3x圖靈芯片)上部署VLA;理想已經(jīng)預(yù)告了除了Thor U版本,VLA也將在雙OrinX版上能跑起來(lái)。
元戎對(duì)今年累計(jì)量產(chǎn)規(guī)模的預(yù)計(jì)是超過(guò)20萬(wàn)輛車,其VLA模型可以支持激光雷達(dá)和純視覺方案,并且正尋求通過(guò)蒸餾的方式適配更多的芯片平臺(tái)。
在開發(fā)車端VLA模型的同時(shí),元戎正在通過(guò)與火山引擎在算力上合作,催化云端模型的迭代。
這些信息意味著,從規(guī)模上來(lái)講,VLA將成為一代非常主流的輔助駕駛大模型。
并且,由于今年絕大部分廠商的旗艦車型在硬件上將會(huì)上馬Thor U,但部分廠商去年在端到端的開發(fā)上并不理想,這倒是提供了更大的機(jī)會(huì),加強(qiáng)車企與供應(yīng)商在先進(jìn)模型上的合作。
在G7的發(fā)布會(huì)上,何小鵬提到自研芯片的攤銷門檻至少是100萬(wàn)片起步;圖靈芯片不光會(huì)用在車上,也會(huì)用在小鵬的飛行汽車以及機(jī)器人上。
對(duì)于大模型的研發(fā)來(lái)說(shuō),其投入規(guī)模也是巨大的,預(yù)計(jì)今年底/明年頭部廠商為輔助駕駛大模型的云端算力投入可能就是以1億美金作為門檻。
理想、小鵬、元戎選擇了VLA,某種程度上也是瞄準(zhǔn)了自動(dòng)駕駛以及通用人工智能的星辰大海,希望借助VLA邁向更加遠(yuǎn)大的目標(biāo)。
從VLA的起源來(lái)回溯,VLA本身最早就是由DeepMind提出來(lái),用于機(jī)器人的模型范式。語(yǔ)言模型加入之后對(duì)推理能力的增加,能極大地幫助機(jī)器系統(tǒng)建立對(duì)世界的認(rèn)知,從而形成更加通用化的能力。
元戎認(rèn)為大語(yǔ)言模型最初是一個(gè)「弱專才」,其發(fā)展過(guò)程經(jīng)歷了「弱專才 - 通才 - 強(qiáng)專才」三個(gè)階段,輔助駕駛模型也會(huì)類似。而現(xiàn)在的VLA模型是輔助駕駛領(lǐng)域的那個(gè)「通才」,是通過(guò)自動(dòng)駕駛的必經(jīng)之路。
作者 | 德新
編輯 | 王博
來(lái)源:第一電動(dòng)網(wǎng)
作者:HiEV
本文地址:http://ewshbmdt.cn/kol/269669
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。