特斯拉 FSD Beta V12 的軟件代碼行數(shù)從 30 萬(wàn)行縮減到 2000 行。
遠(yuǎn)在北美的特斯拉車(chē)主們,陷入了一場(chǎng)驚奇、詫異、狂歡等各種情緒組成的渦流中。情緒的來(lái)源,則是和特斯拉近期的 FSD Beta V12 一系列推送有關(guān):
在這一次的版本更新說(shuō)明中,特斯拉提到,此前負(fù)責(zé)城區(qū)智駕的堆棧已經(jīng)升級(jí)為單一的端到端神經(jīng)網(wǎng)絡(luò),而接近 30 萬(wàn)行 C++ 代碼已經(jīng)由經(jīng)過(guò)數(shù)百萬(wàn)個(gè)視頻片段的訓(xùn)練替代。
這是特斯拉面向普通用戶(hù)的一次重磅更新,帶來(lái)的影響不止是 X 上涌現(xiàn)的各種“民間短視頻”,北美人們的熱情還刮到了微博、微信等中文互聯(lián)網(wǎng)社交平臺(tái)上……
當(dāng)然,端到端(end-to-end)這個(gè)詞在本土市場(chǎng)上也不是第一次出現(xiàn)——事實(shí)上小米 SU7 已經(jīng)宣布其為首個(gè)量產(chǎn)端到端記憶泊車(chē)的車(chē)型。
這很可能是 2024 年智能化領(lǐng)域最熱門(mén)的技術(shù)詞匯,或許也有可能是最熱門(mén)的營(yíng)銷(xiāo)詞匯。但在此之前,端到端是什么、端到端能帶來(lái)什么、端到端會(huì)不會(huì)向 BEV+tranformer+OCC 那樣成為國(guó)內(nèi)智駕內(nèi)卷的新階段技術(shù)……諸多疑點(diǎn),讓我們先行觀察,再?lài)L試解答一番。
在嘗試解讀端到端的原理之前,我想對(duì)于端到端最初始的思考,是有充分必要的溯源的。
我們?nèi)粘K峒暗母咚僦邱{、城區(qū)智駕,在現(xiàn)階段,這兩項(xiàng)功能的實(shí)現(xiàn)原理,大致可以總結(jié)如下:
首先,由車(chē)外的傳感器采集路面信息數(shù)據(jù),通過(guò)我們熟知的各種算法,如 BEV+Transformer+OCC ,本質(zhì)上是將現(xiàn)實(shí)世界解構(gòu)重繪,讓車(chē)內(nèi)的智能駕駛控制域先行理解現(xiàn)實(shí)世界中可能存在的信息;
其次,控制域根據(jù)算法解析的世界,進(jìn)行車(chē)輛行進(jìn)路線(xiàn)的規(guī)劃;
最后,控制域發(fā)出指令,控制車(chē)輛的油門(mén)/剎車(chē)深度、方向盤(pán)轉(zhuǎn)向等行駛參數(shù)。
上述是對(duì)于現(xiàn)階段智能駕駛比較粗略的原理解析,我們?cè)谄渲锌梢钥吹?,控制域不能直接接收現(xiàn)實(shí)道路的原始數(shù)據(jù)信息,必須經(jīng)由算法重繪、提取特征,才能進(jìn)行后續(xù)的規(guī)控。就像是新生兒父母為寶寶打造營(yíng)養(yǎng)輔食——小孩子(智駕控制域)不能直接消化原始的食材(現(xiàn)實(shí)世界信息)。
而上一段的陳述,顯然是為了端到端大模型的登場(chǎng)做準(zhǔn)備:端到端大模型,從字面意思理解,便是直接學(xué)習(xí)/提取現(xiàn)實(shí)世界特征,無(wú)需對(duì)數(shù)據(jù)進(jìn)行多次算法加工(即感知-規(guī)劃-控制),即可令智駕控制域輸出行車(chē)指令。
從理論角度分析,端到端大模型上車(chē)的優(yōu)勢(shì)顯而易見(jiàn)——不同于現(xiàn)階段的智能駕駛需要進(jìn)行流水線(xiàn)般在多個(gè)模塊運(yùn)行處理得到最終結(jié)果,端到端就像是一個(gè)盒子,把數(shù)據(jù)丟進(jìn)去,把指令生成出來(lái),基于數(shù)據(jù)驅(qū)動(dòng)的表現(xiàn)給人非常直觀的反饋。
但細(xì)心的朋友應(yīng)該注意到了,我在提及端到端優(yōu)點(diǎn)時(shí),開(kāi)頭是“從理論上”。
回歸到智能駕駛本質(zhì),其并不等同于自動(dòng)駕駛,因此在過(guò)往、現(xiàn)在、甚至往后較長(zhǎng)的一段時(shí)間里,我們都會(huì)處在“人機(jī)共駕”的狀態(tài)中——智能駕駛本質(zhì)是將人類(lèi)司機(jī)駕駛的邏輯用算法進(jìn)行分割重繪,結(jié)合感知信息,讓智能駕駛盡量模擬人類(lèi)司機(jī)的行駛軌跡。
問(wèn)題也就出現(xiàn)在此:如果將人駕邏輯理解成一塊完整的面包,智駕必須將人駕這塊“面包”進(jìn)行切割再消化,但刀法(算法)的不一,導(dǎo)致由于切割掉在地上的面包屑灑落或多或少。這部分沒(méi)能消化的面包屑,便是智能駕駛觸達(dá)的邊界,即需要人類(lèi)司機(jī)接管的時(shí)刻,又稱(chēng) Corner Cases。
而端到端大模型,更像是直接將整塊“面包”進(jìn)行囫圇吞棗的操作——特斯拉當(dāng)然能輕易吞吐數(shù)百萬(wàn)的“老司機(jī)式駕駛”視頻訓(xùn)練片段,但如果進(jìn)行全量開(kāi)放后,純粹的端到端大模型極有可能吃到“發(fā)霉的面包”。
就像最開(kāi)始的 ChatGPT 般,無(wú)論好壞的互聯(lián)網(wǎng)信息都會(huì)進(jìn)行吞吐,輸出錯(cuò)誤的暴論。
因此,在特斯拉并未對(duì)此次端到端神經(jīng)網(wǎng)絡(luò)的更新做出更進(jìn)一步說(shuō)明時(shí),外界也有部分猜測(cè):特斯拉 FSD Beta V12 版本中升級(jí)的端到端神經(jīng)網(wǎng)絡(luò)并不是端到端“完全體”,其依舊保留了部分感知與規(guī)控模塊的代碼。
上文有提及到,在推送了 FSD Beta V12.3 以及后續(xù)版本后,大洋彼岸的北美,同樣是馬斯克旗下的社交軟件 X 上迸發(fā)出了非常之多的“民間小視頻”。
但在諸多媒體/KOC/素人發(fā)布的視頻浪潮下,F(xiàn)SD 有一個(gè)非常耐人尋味的表現(xiàn),并沒(méi)有遭到更多人的提及——在某些情況下,當(dāng)智駕控制域的路線(xiàn)規(guī)劃要優(yōu)于地圖導(dǎo)航路線(xiàn)規(guī)劃時(shí),智駕控制域會(huì)給車(chē)輛發(fā)送行駛更優(yōu)路線(xiàn)的指令。
在這段視頻中便體現(xiàn)了上一段的說(shuō)法:車(chē)輛并沒(méi)有行駛地圖導(dǎo)航給出的掉頭路線(xiàn),而是直接采用更優(yōu)的左轉(zhuǎn)進(jìn)入目的地。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話(huà)窗口。Escape鍵將取消并關(guān)閉對(duì)話(huà)窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話(huà)窗口
無(wú)論是高速 NOA 還是城區(qū) NOA ,其本質(zhì)的核心人設(shè)都是一致的,那便是地圖導(dǎo)航位于路線(xiàn)規(guī)劃的最高優(yōu)先級(jí),正所謂 NOA 的全稱(chēng)“領(lǐng)航輔助駕駛”,而特斯拉 FSD 卻似乎違背了這一點(diǎn)。
在沒(méi)有更近一步說(shuō)明的情況下,我們尚無(wú)法根據(jù)這種行為做出更深層次的分析,但我們有著國(guó)內(nèi)的內(nèi)卷案例可供分析:全國(guó)都能開(kāi)。
根據(jù)目前國(guó)內(nèi)一些頭部智駕團(tuán)隊(duì)負(fù)責(zé)人的說(shuō)法,“全國(guó)都能開(kāi)”的功能,本質(zhì)上就是一種另類(lèi)的 LCC 呈現(xiàn)方式——
首先意味著,當(dāng)真正的“全國(guó)都能開(kāi)”進(jìn)行全民化普及,車(chē)輛上的 LCC 功能將有可能徹底會(huì)被 NOA/NCA 等代替;
其次,即使是“另類(lèi)的 LCC”,LCC 功能本身,便不強(qiáng)依賴(lài)地圖導(dǎo)航路線(xiàn)信息……
看似風(fēng)馬牛不相及的功能和技術(shù)路線(xiàn),不同的市場(chǎng)環(huán)境,卻幾乎要走向相同的目標(biāo),不免令人有些驚訝。
在最近一次的 FSD 更新推送中,特斯拉徹底取締了“Beta”測(cè)試詞匯, 原先的“ FSD Beta ”更名為 “ FSD (Supervised) ”。
與此同時(shí),特斯拉還刪除了部分說(shuō)明,如「始終保持雙手握在方向盤(pán)上」、「這不會(huì)讓你的車(chē)自動(dòng)化運(yùn)行」、刪除數(shù)據(jù)采集同意協(xié)議……
馬斯克與他的特斯拉在自動(dòng)駕駛的道路上走了多遠(yuǎn),在以前或許只有他自己,或者他的團(tuán)隊(duì)們知道。但現(xiàn)在看來(lái),似乎這位 AI 狂人,要開(kāi)始向我們揭示自動(dòng)駕駛新一輪的技術(shù)節(jié)點(diǎn)了。
當(dāng)然,只要他不說(shuō)出“全國(guó)都能開(kāi)”(相信他知道這個(gè)梗),那特斯拉依舊還會(huì)是那個(gè)特斯拉,而不是標(biāo)榜自己作為機(jī)器人公司,卻因?yàn)槎唐诘钠?chē)銷(xiāo)量下滑與傳統(tǒng)品牌舉例計(jì)較一二的“平庸車(chē)企”模樣。
來(lái)源:第一電動(dòng)網(wǎng)
作者:新出行
本文地址:http://ewshbmdt.cn/carnews/pingce/225376
以上內(nèi)容轉(zhuǎn)載自新出行,目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(ewshbmdt.cn)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。