「『端到端』并非靈丹妙藥?!?/span>
乍看之下,蔚來(lái) AI 平臺(tái)負(fù)責(zé)人、資深研發(fā)總監(jiān)白宇利這一觀點(diǎn),容易讓外界產(chǎn)生蔚來(lái)動(dòng)搖對(duì)端到端路線的誤會(huì)。
實(shí)際上,這是蔚來(lái)方案的重申。蔚來(lái)計(jì)劃是把規(guī)劃和控制的代碼模型化之后,再做更具整合性的「端到端」大模式。
目前,小鵬、理想、蔚來(lái)的「端到端」大模式路線,都是類(lèi)似「散裝」——「打散了重裝」——「端到端」大模式。
6 月 8 日,在 2024 中國(guó)汽車(chē)重慶論壇上,理想汽車(chē)董事長(zhǎng)兼 CEO 李想發(fā)表了關(guān)于自動(dòng)駕駛技術(shù)路線的新思考:
「端到端+VLM(視覺(jué)語(yǔ)言模型)+生成式的驗(yàn)證系統(tǒng),會(huì)是未來(lái)整個(gè)物理世界機(jī)器人最重要技術(shù)架構(gòu)和技術(shù)體系?!?/span>
李想認(rèn)為不能依賴(lài)端到端解決 corner case,而是要提升能力。用視覺(jué)語(yǔ)言模型即 VLM,讓車(chē)面對(duì)路口、紅綠燈等能夠及時(shí)作出反應(yīng)。
作為「國(guó)內(nèi)首個(gè)端到端上車(chē)」的車(chē)企,5 月 20 日,小鵬汽車(chē)宣布上車(chē)的端到端大模型由三部分組成,分別是神經(jīng)網(wǎng)絡(luò) XNet(側(cè)重于感知和語(yǔ)義),規(guī)控大模型 XPlanner 和大語(yǔ)言模型 XBrain(側(cè)重于整個(gè)大場(chǎng)景的認(rèn)知)。
小鵬、理想、蔚來(lái)的策略,有別于特斯拉提出的借助完全依賴(lài)神經(jīng)網(wǎng)絡(luò)處理的「端到端」大模型,解決 corner case——神經(jīng)網(wǎng)絡(luò)只是一個(gè)環(huán)節(jié)。
說(shuō)起來(lái),國(guó)內(nèi)智駕行業(yè)論壇聊起來(lái)都沒(méi)人知道,特斯拉到底是怎么做到的。
「沒(méi)有任何人敢說(shuō)端到端都是神經(jīng)網(wǎng)絡(luò)?!乖凇付说蕉恕拱l(fā)布會(huì)后,何小鵬接受媒體采 訪時(shí)表示,「它是在一個(gè)體系里面完成的,就像剎車(chē)在哪里,它一定是有規(guī)則體系的。我們?cè)谝?guī)則體系里面有一個(gè)優(yōu)勢(shì),能夠把剎車(chē)控制器的算法沙盒做好?!?/span>
英偉達(dá)汽車(chē)事業(yè)部副總裁吳新宙認(rèn)為,端到端正是智駕三部曲的最終曲。
面對(duì)終局之戰(zhàn),今年 2 月,特斯拉端到端大模式啟動(dòng)商業(yè)化孩子會(huì),前后幾家新勢(shì)力代表的車(chē)企立下「端到端」上線時(shí)間表。
2024 年過(guò)去了一半,今年能否成為端到端上車(chē)「元年」?
從國(guó)內(nèi)的小鵬率先上車(chē)端到端大模式,回溯到「古典主義」端到端大模式的特斯拉,要攻下端到端堡壘,國(guó)內(nèi)車(chē)企應(yīng)該怎么走?繪制一張從學(xué)界到業(yè)界完整端到端大模型的圖譜,或許能夠讓人們找到車(chē)企在其中的位置。
01、小鵬之后,下一個(gè)「端到端」智駕規(guī)模化量產(chǎn)是誰(shuí)?
2023 年 8 月,特斯拉 FSD V12 版本問(wèn)世,成為首家成功量產(chǎn)「端到端」架構(gòu)的車(chē)企。
今年 2 月,特斯拉將基于端到端架構(gòu)的 FSD V12 版本向部分普通用戶推送,啟動(dòng)商業(yè)化落地。
FSD V12 的流暢性、令人驚艷的體驗(yàn)感,初露鋒芒。
2024 年 5 月,小鵬宣布「端到端」架構(gòu)上車(chē)。
整體來(lái)說(shuō),以車(chē)企為代表,「端到端」有三大派:整車(chē)廠、自動(dòng)駕駛企業(yè)、學(xué)術(shù)機(jī)構(gòu)。學(xué)界和工業(yè)界一些切入「端到端」大模式甚至早于特斯拉。
車(chē)企方面,蔚來(lái)、理想、小鵬、小米、極越、智己、廣汽、長(zhǎng)城、極氪等,成為國(guó)內(nèi)第一批公開(kāi)行動(dòng)或表態(tài)者。
近期,蔚來(lái)單獨(dú)設(shè)立了一個(gè)大模型部,專(zhuān)門(mén)負(fù)責(zé)端到端的模型研發(fā),由原感知部門(mén)和規(guī)控部門(mén)下的模型部合并而來(lái)。
調(diào)整后,蔚來(lái)智駕的核心業(yè)務(wù),分為「云」(大模型部)和「車(chē)」(部署架構(gòu)與方案部)兩塊,取消原來(lái)按照功能(感知、地圖、數(shù)據(jù)、規(guī)控等)模塊劃分的方式。
「云」負(fù)責(zé)創(chuàng)造出更好的基礎(chǔ)模型,去支持未來(lái)「車(chē)」端的迭代。
「云」,意味著迅速打破算力瓶頸的可能。
目前,蔚來(lái)打通了邊緣計(jì)算的能力,車(chē)云算力聯(lián)合調(diào)度,在蔚來(lái)整體端云上的算力,有 287.1 EOPS,相當(dāng)于 100 個(gè)分布式的千卡訓(xùn)練集群,「這基本和特斯拉的 10 萬(wàn)片 H100 的算力規(guī)模差不多。」
蔚來(lái)采取的是漸進(jìn)式「端到端」大模型技術(shù)路線。
蔚來(lái)智能駕駛研發(fā)副總裁任少卿認(rèn)為,做端到端大模型的前提是智駕各功能模塊都已經(jīng)完成模型化,且足夠性能與效率的工程體系支撐,「大家沒(méi)辦法模型化,很多時(shí)候是因?yàn)槟愕墓こ腆w系支撐不了這件事」。
比如,需要有快速訓(xùn)練一個(gè)模型再快速驗(yàn)證的能力,「你這個(gè)事兒才玩的下去」「你得有一些基本的能力之后,(端到端大模型)這玩意才有用,否則它是個(gè)毒藥?!?/span>
2023 年年底,理想在「算法研發(fā)」團(tuán)隊(duì)下也為端到端模型單獨(dú)成立了一個(gè)團(tuán)隊(duì)。
算法研發(fā)除了要負(fù)責(zé)端到端模型的研發(fā),也要負(fù)責(zé)三季度無(wú)圖城市 NOA 的量產(chǎn)。
目前,理想正在做端到端架構(gòu)的封閉開(kāi)發(fā):端到端+VLM(視覺(jué)語(yǔ)言模型)+生成式的驗(yàn)證系統(tǒng)。
「最早在今年年底,最晚在明年上半年,真正有監(jiān)督的 L3 自動(dòng)駕駛就可以批量向用戶交付了,而不是做實(shí)驗(yàn)?!苟?,「L4 級(jí)別無(wú)監(jiān)督的自動(dòng)駕駛在三年內(nèi)一定能夠?qū)崿F(xiàn)?!估钕氡硎尽?/span>
此前,理想汽車(chē)與清華大學(xué)交叉信息研究院一直在進(jìn)行聯(lián)合研究。
今年 2 月,雙方團(tuán)隊(duì)聯(lián)合發(fā)布了論文《DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models》。
小鵬的端到端大模型,據(jù)說(shuō)未來(lái)能實(shí)現(xiàn) 2 天一次迭代,未來(lái) 18 個(gè)月智駕能力提升 30 倍。
有別于外界以前覺(jué)得端到端 AI 大模型就是一個(gè)大的網(wǎng)絡(luò),小鵬汽車(chē)智能駕駛技術(shù)負(fù)責(zé)人李力耘表示:
「我們對(duì) AI 的認(rèn)知也提出了 XBrain、XNet、XPlanner,既有聯(lián)系又有分工,能夠非常好地提升 AI 智駕能力上限?!?/span>
這是小鵬真正去量產(chǎn)端到端大模型的一個(gè)重要原因。
除了「蔚小理」,還有幾家態(tài)度比較明確。
去年 12 月 28 日,雷軍在小米汽車(chē)發(fā)布會(huì)上宣布:「小米汽車(chē)首次運(yùn)用自研的『端到端』感知決策大模型」,并稱(chēng)這是全球首次應(yīng)用于量產(chǎn)車(chē)。圖森未來(lái)的前 CTO 王乃巖加入小米智駕團(tuán)隊(duì),王乃巖曾指出,從業(yè)者不能被特斯拉「帶偏」,陷入到狹義的端到端理解中。
極越 CEO 夏一平表示,「下一步研發(fā)重點(diǎn)將是端到端大模型」。
智己汽車(chē)聯(lián)席 CEO 劉濤稱(chēng),「目前智己汽車(chē)也正在全力推動(dòng)『端到端』架構(gòu)落地,創(chuàng)造『更像人』的智能駕駛體驗(yàn)」。目前,智己正和 Momenta 合作,推動(dòng)端到端智駕大模型量產(chǎn)落地。
廣汽研究院也表示正在探索「端到端」自動(dòng)駕駛方案,「并取得初步成效」。
長(zhǎng)城(毫末智行)在去年 4 月發(fā)布自動(dòng)駕駛生成式大模型「雪湖·海若」時(shí)表示,將對(duì)自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,最終實(shí)現(xiàn)「端到端」自動(dòng)駕駛。現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問(wèn)題。
一些車(chē)企采取了比較謹(jǐn)慎的態(tài)度,比如極氪。極氪內(nèi)部認(rèn)為「在數(shù)據(jù)量不充分、安全性難以保證的當(dāng)下,更多將『端到端』技術(shù)路線作為預(yù)研項(xiàng)目」。
整體來(lái)說(shuō),大部分車(chē)企和極氪類(lèi)似,認(rèn)可「端到端」的發(fā)展趨勢(shì),行業(yè)轉(zhuǎn)向『端到端』架構(gòu)的方向非常明確。
二是智駕供應(yīng)商,已經(jīng)有多家發(fā)出比較堅(jiān)定的技術(shù)轉(zhuǎn)向的聲音,并有方案正在推出。目前,包括華為、Momenta、元戎啟行、商湯絕影等國(guó)內(nèi)頭部企業(yè)已經(jīng)公開(kāi)端到端自動(dòng)駕駛方案在 2024-2025 年上車(chē)的規(guī)劃。
三是學(xué)術(shù)界方面,以上海人工智能實(shí)驗(yàn)室,跨界合作的華中科技大學(xué)(與地平線合作)和南洋理工大學(xué)(和英偉達(dá)合作)以及劍橋大學(xué)工程系團(tuán)隊(duì)創(chuàng)辦的 Wayve 等為代表,推出多篇優(yōu)秀論文。
上海人工智能實(shí)驗(yàn)室的自動(dòng)駕駛?cè)珬?煽亍付说蕉恕狗桨?UniAD 相關(guān)研究,獲得人工智能頂會(huì) CVPR(國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議)2023 年最佳論文,是「端到端」架構(gòu)最受關(guān)注的項(xiàng)目之一。
今年 2 月,華中科技大學(xué)、地平線共同發(fā)布了《VADv2: End-to-End Vectorized Autonomous Driving via Probabilistic Planning》,提出 VAD v2「端到端」自動(dòng)駕駛模型,一個(gè)基于概率規(guī)劃的「端到端」駕駛模型。
此外,南洋理工大學(xué)和英偉達(dá)也合作提出了一個(gè)新框架。
實(shí)際上,早在幾年前英偉達(dá)已經(jīng)在使用「端到端」深度學(xué)習(xí),并開(kāi)發(fā)出了無(wú)人駕駛的 Demo 系統(tǒng)。
署名作者 Gongjin Lan、Qi Hao 近期發(fā)布論文《End-To-End Planning of Autonomous Driving in Industry and Academia: 2022-2023》梳理2022 年-2023 年工業(yè)界和學(xué)術(shù)界中的自動(dòng)駕駛「端到端」規(guī)劃(左側(cè)欄為各公司及研究機(jī)構(gòu)項(xiàng)目)
「端到端」的出現(xiàn)是相關(guān)技術(shù)長(zhǎng)期積累的結(jié)果,但仍處于上車(chē)的初級(jí)階段。
應(yīng)對(duì)長(zhǎng)尾問(wèn)題(corner case)的能力更強(qiáng),不少車(chē)企或許都能實(shí)現(xiàn),但是在這背后容易忽視的是「端到端」大模型系統(tǒng)實(shí)現(xiàn)所要付出的成本。
02、大模型之后,「端到端」走向高端&低端?
「端和端」架構(gòu)正在分出不同的發(fā)展脈絡(luò)。
在特斯拉 FSD V12 中,靠神經(jīng)網(wǎng)絡(luò)模型完成的落地效果已經(jīng)收到不少追捧聲音。
由于不再需要用于設(shè)置規(guī)則的具體指令,特斯拉工程師刪除了 30 萬(wàn)行定義駕駛規(guī)則的 C++代碼。
曾備受關(guān)注的上海人工智能實(shí)驗(yàn)室的自動(dòng)駕駛?cè)珬?煽亍付说蕉恕狗桨?UniAD 的提出者李弘揚(yáng),在 2021 年注意到自動(dòng)駕駛系統(tǒng)開(kāi)源項(xiàng)目 Openpilot,一個(gè)「端到端」的系統(tǒng)設(shè)計(jì)。
相比特斯拉,他驚嘆于 Openpilot 低成本實(shí)現(xiàn)的良好效果,并感慨:原來(lái)自動(dòng)駕駛可以做得如此簡(jiǎn)單。
這是他開(kāi)啟 UniAD 研究的一個(gè)關(guān)鍵節(jié)點(diǎn)。
同樣是「端到端」,如果說(shuō)特斯拉的「端到端」是高「端」,那么李弘揚(yáng)相關(guān)的這種低成本「端到端」可謂之低「端」。
這個(gè)對(duì)比或有不恰當(dāng)之處,但是仍然極具闡釋力:
在高「端」到低「端」之間,「端到端」架構(gòu)可以分出來(lái)具備不同特征、實(shí)現(xiàn)效果存在差異的多個(gè)技術(shù)流派。
在自動(dòng)駕駛行業(yè),對(duì)「端到端」自動(dòng)駕駛作評(píng)估有兩類(lèi)辦法:
一是閉環(huán)評(píng)估和開(kāi)環(huán)評(píng)估——這是每個(gè)端到端架構(gòu)未來(lái)都要面對(duì)的專(zhuān)門(mén)測(cè)試。
閉環(huán)評(píng)估可以接受到反饋信號(hào)從而形成反饋閉環(huán);開(kāi)環(huán)評(píng)估則是分模塊進(jìn)行,并和真實(shí)數(shù)據(jù)作對(duì)比。比如,UniAD 在開(kāi)環(huán)評(píng)估中得到驗(yàn)證,但是尚未在閉環(huán)評(píng)估中得到驗(yàn)證。
那么,哪家的「端到端」效果最好?如何用一個(gè)簡(jiǎn)單指標(biāo)來(lái)衡量端到端大模型的有效性?
何小鵬說(shuō),對(duì)于端到端大模型的硬指標(biāo),最終看接管率。今天高速如果沒(méi)有續(xù)航的問(wèn)題,可以做到 1000 公里接管一次。
在城區(qū),今天所有的城市輔助駕駛,我認(rèn)為安全接管可能是百公里或者一兩百公里。但體驗(yàn)接管是十公里以?xún)?nèi)。
如果在城區(qū)開(kāi) 100 公里、300 公里、500 公里接管一次,體驗(yàn)完全不一樣。
可以對(duì)比的是,特斯拉應(yīng)用端到端神經(jīng)網(wǎng)絡(luò)架構(gòu)的 FSD V12 的平均接管歷程從此前的 166 英里(約 267 公里)提升到了 333 英里(約 537 公里)。
「端到端」的實(shí)現(xiàn),與 BEV+Transformer 模型關(guān)系十分密切。
車(chē)輛在感知模塊產(chǎn)生 BEV(Bird『s-eye-view),即鳥(niǎo)瞰圖視角,始于 2014 年的一篇論文(《「Automatic Parking Based on a Bird』s Eye View Vision System》)。
Transformer 模型則是 2017 年時(shí) Google 提出的。
2020 年前后,Transformer 模型被引入到智駕領(lǐng)域,特斯拉率先將 BEV 與 Transformer 結(jié)合在一起。
在 2021 年底至 2022 年間,BEV 與 Transformer 實(shí)現(xiàn)深度融合,通過(guò) Attention 機(jī)制,感知模塊和預(yù)測(cè)模塊可以通過(guò)神經(jīng)網(wǎng)絡(luò)做到「端到端」的優(yōu)化。
在感知、預(yù)測(cè)、規(guī)劃、決策的分模塊的算法中,主要用于感知模塊的 BEV+Transformer 范式可以有效提升了感知精確度,能夠?qū)⒏兄K和預(yù)測(cè)模塊在統(tǒng)一的 3D 空間中實(shí)施,通過(guò)神經(jīng)網(wǎng)絡(luò)直接完成「端到端」優(yōu)化。
這直接促進(jìn)了智駕的進(jìn)一步 AI 化。
從感知、預(yù)測(cè),深入至完全的「端到端」自動(dòng)駕駛框架,最終可以用神經(jīng)網(wǎng)絡(luò)模型全部替換此前的規(guī)則代碼——這就是特斯拉古典式的「端到端」大模式。
BEV+Transformer 模型規(guī)模化落地,也是今天「端到端」有可能迅速成為現(xiàn)實(shí)的一大原因。
但是,對(duì)「端到端」懷疑的聲音一直存在。
早在 2016 年,Momenta 創(chuàng)始人曹旭東在回復(fù)「無(wú)人駕駛『端到端』的學(xué)習(xí)(end-to-end learning)是否靠譜?」時(shí)指出:
「對(duì)于無(wú)人駕駛,『端到端』不適合開(kāi)發(fā)實(shí)用無(wú)人駕駛系統(tǒng),可以做 Demo,然而大規(guī)模商用卻非常困難」。
當(dāng)時(shí)曹旭東否定「端到端」的原因有三點(diǎn):
一是「不聰明」。「端到端」會(huì)產(chǎn)生「大量冗余數(shù)據(jù)和計(jì)算」。與之對(duì)比,如果把整個(gè)無(wú)人駕駛拆解成感知、地圖、決策三部分,分別獨(dú)立學(xué)習(xí)再融合,可以大大降低需要的數(shù)據(jù)和計(jì)算。
二是「不靈活」。在作一些系統(tǒng)調(diào)整后,收集數(shù)據(jù)學(xué)習(xí)的過(guò)程,往往需要推倒重來(lái)。
三是「難理解」。相比模塊化,「對(duì)于整體『端到端』學(xué)習(xí),一旦出現(xiàn)問(wèn)題,因?yàn)闊o(wú)法對(duì)癥下藥」,即「黑箱」難題。
時(shí)隔多年,這些問(wèn)題今天也或多或少仍然存在。
不過(guò),當(dāng)時(shí)他也坦誠(chéng),「我并不是完全否定『端到端』學(xué)習(xí),而是無(wú)人駕駛『端到端』學(xué)習(xí)目前存在以上問(wèn)題,或許在將來(lái)可以得到解決?!?/span>
時(shí)至今日,曹旭東對(duì)「端到端」的態(tài)度完全轉(zhuǎn)變,Momenta 成為最看好「端到端」落地的積極派中的一員。
這個(gè)案例,正是「端到端」近年在自動(dòng)駕駛領(lǐng)域內(nèi)境遇變化的最好展現(xiàn)。
幾年過(guò)去了,自動(dòng)駕駛技術(shù)脈絡(luò)也從模塊化走到了神經(jīng)網(wǎng)絡(luò)?!付说蕉恕沟拿媸?,時(shí)候到了。
03、AI 引領(lǐng)革命,打贏「端到端」之戰(zhàn)核心靠算力?
刺激 2024 年 2 月至年中「端到端」這波話題走高,源于特斯拉 FSD 12.0 版本開(kāi)啟推送,以及 Sora 的大火。
Sora 是基于「端到端」的 Transformer 來(lái)實(shí)現(xiàn)的。
而它生成視頻像素的能力,是解決「端到端」自動(dòng)駕駛問(wèn)題的關(guān)鍵。
「端到端」自動(dòng)駕駛訓(xùn)練的核心是視頻生成。
因此,Sora 富有質(zhì)感的視頻,一定程度證明「端到端」路線的正確性。
特斯拉 CEO 馬斯克自信地對(duì)外稱(chēng):
「特斯拉擁有世界上最好的現(xiàn)實(shí)世界模擬和視頻生成能力」。
「特斯拉在大約一年前就能以精確的物理生成真實(shí)世界的視頻」。
與此同時(shí),他也指出:
「我們的FSD 訓(xùn)練算力不足,所以還沒(méi)有使用其他的視頻(所有的訓(xùn)練數(shù)據(jù)都來(lái)自汽車(chē))進(jìn)行訓(xùn)練,但當(dāng)然是可行的。今年晚些時(shí)候,當(dāng)我們有空余算力時(shí),就會(huì)進(jìn)行訓(xùn)練?!?/span>
實(shí)際上,算力難題一直存在。
2023 年 8 月,馬斯克指出,F(xiàn)SD AI 的實(shí)現(xiàn)進(jìn)程「眼下的限制因素在于訓(xùn)練的算力,而非工程師人力」。
算力的稀缺和昂貴,已經(jīng)成為制約 AI 發(fā)展的核心因素。
國(guó)內(nèi)發(fā)展「端到端」,首先要考慮提升算力的實(shí)力。
從大模型之戰(zhàn)開(kāi)始,囤算力成為各家行業(yè)公司的基本操作。
2022 年 8 月,阿里云宣布正式啟動(dòng)張北超級(jí)智算中心,當(dāng)時(shí)號(hào)稱(chēng)「全球最大的智算中心」:總建設(shè)規(guī)模為 12EFLOPS(每秒 1200 億億次浮點(diǎn)運(yùn)算)AI 算力,超過(guò)谷歌的 9EFLOPS 和特斯拉的 1.8EFLOPS。
同年 8 月 2 日,小鵬汽車(chē)宣布和阿里云合作在烏蘭察布建成當(dāng)時(shí)中國(guó)最大的自動(dòng)駕駛智算中心「扶搖」。
「扶搖」算力可達(dá) 600PFLOPS(每秒浮點(diǎn)運(yùn)算 60 億億次),將小鵬自動(dòng)駕駛核心模型的訓(xùn)練速度提升了近 170 倍。
以最新公布的車(chē)企與智駕供應(yīng)商的算力情況作對(duì)比:
特斯拉:截至 2023 年 8 月,算力達(dá)到 10 EFLOPS(預(yù)計(jì) 2024 年 10 月,Dojo 智算中心算力可達(dá) 100EFLOPS)。
理想:截止 6 月,訓(xùn)練平臺(tái)算力達(dá) 2.4EFLOPS。
長(zhǎng)安:最新披露,1.42EFLOPS。
蔚來(lái):2023 年 9 月,智算集群總算力規(guī)模為 1.4EFLOPS。
極越:2 月最新數(shù)據(jù)顯示,其算力在 1.8-2.2EFLOPS 范圍之內(nèi)。
吉利:2 月和阿里云成立「星睿智算中心」,計(jì)算能力達(dá)到 810PFLOPS。
長(zhǎng)城:1 月毫末智行和火山引擎合作「雪湖·綠洲」智算中心,稱(chēng)其算力達(dá) 670PFLOPS。
小鵬:最新披露,600PFLOPS。
華為:最新披露,3.5EFLOPS。
商湯絕影:12EFLOPS(2024 年底將達(dá)到 18EFLOPS。)——這也是國(guó)內(nèi)已知的用于自動(dòng)駕駛訓(xùn)練的最大算力。
在華為全聯(lián)接大會(huì) 2023 期間,華為發(fā)布昇騰 AI 計(jì)算集群 Atlas 900 SuperCluster,并表示:「中國(guó)一半大模型的算力都是由華為提供」。
即便如此,若特斯拉如期達(dá)到最新算力目標(biāo),國(guó)內(nèi)智算中心的算力都將滯后。
從 10 EFLOPS,再到下一步計(jì)劃的 100EFlops,特斯拉正在以 5 到 10 倍的增速實(shí)現(xiàn)算力擴(kuò)張。
今年 2 月,特斯拉增加了 5 億美元投資在超算中心 Dojo,值得注意的是,特斯拉的人形機(jī)器人業(yè)務(wù) Optimus 也將通過(guò) Dojo 訓(xùn)練。
當(dāng)特斯拉已經(jīng)在訓(xùn)練「端到端」大模型時(shí),國(guó)內(nèi)車(chē)企及自動(dòng)駕駛企業(yè)才剛起步。
6 月 4 日,馬斯克發(fā)推特表示,特斯拉買(mǎi)了 10 萬(wàn)片卡,在德州的工廠上擴(kuò)展了一個(gè)數(shù)據(jù)中心,放了 5 萬(wàn)片卡進(jìn)去。
那么,在國(guó)內(nèi)要做端到端大模型,需要多少量級(jí)的「卡」(大算力 GPU)?
特斯拉的 DOJO 智算中心,預(yù)計(jì)到 2024 年 10 月,總算力將達(dá)到 100EFLOPs(10 萬(wàn) PFLOPS),相當(dāng)于約 30 萬(wàn)塊英偉達(dá) A100 的算力總和。
以小鵬「扶搖」自動(dòng)駕駛智算中心為例,算力可達(dá) 600PFLOPS(以英偉達(dá) A100 GPU 的 FP32 算力推算,約等于 3 萬(wàn)張 A100 GPU)。
100 張大算力 GPU 可以支持一次端到端模型的訓(xùn)練。大部分研發(fā)端到端自動(dòng)駕駛的公司目前的訓(xùn)練算力規(guī)模在千卡級(jí)別(100 張 A100)。
毫末智行表示,要實(shí)現(xiàn)全國(guó)都能開(kāi),2000-5000 張 GPU 已經(jīng)足夠。
整體來(lái)說(shuō),盡管和特斯拉存在較大差距,但是國(guó)內(nèi)車(chē)企到 2024 年底實(shí)現(xiàn)算力的倍數(shù)級(jí)增長(zhǎng),并非沒(méi)有可能,并且能夠接近 1~2 年前的特斯拉。
數(shù)據(jù)、算力、算法,人工智能發(fā)展的三件套,僅算力一項(xiàng),就可能讓各大車(chē)企或自動(dòng)駕駛企業(yè)拉開(kāi)距離。
國(guó)內(nèi)車(chē)企并不悲觀。
夏一平曾表示,「特斯拉雖然有一定領(lǐng)先,但極越在中國(guó)的落地能力一定更強(qiáng)」。
同樣是純視覺(jué)路線,極越已經(jīng)進(jìn)化至占用網(wǎng)絡(luò)階段,確實(shí)更了解中國(guó)更加復(fù)雜的路況等,從數(shù)據(jù)積累的環(huán)節(jié)已經(jīng)和特斯拉在走分岔路。
眼下,城市 NOA 的落地仍是眼下競(jìng)爭(zhēng)的主戰(zhàn)場(chǎng)。城市 NOA 的刺激,「端到端」的落地,讓國(guó)內(nèi)車(chē)企及智駕供應(yīng)商拿出各自新方案,同臺(tái)競(jìng)技,決出勝負(fù)為時(shí)不遠(yuǎn)。
來(lái)源:第一電動(dòng)網(wǎng)
作者:汽車(chē)之心
本文地址:http://ewshbmdt.cn/kol/236526
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。