隨著去年ChatGPT走紅后,大模型的熱度便持續(xù)不減,AI技術(shù)正在加速顛覆各行各業(yè)。近日,一則奔馳與微軟合作將ChatGPT接入車輛測試的消息引發(fā)輿論關(guān)注,微軟發(fā)言人稱其是ChatGPT在汽車上的首次應(yīng)用。一時間,關(guān)于“大模型上車”的話題開始頻頻見諸報端。事實上,從今年上半年開始,國內(nèi)眾多科技巨頭就已經(jīng)紛紛發(fā)布了旗下的AI大模型產(chǎn)品,如百度文心一言、阿里通義千問、訊飛星火等,并且已經(jīng)開啟了與主機(jī)廠之間的合作。業(yè)內(nèi)普遍認(rèn)為,AI大模型有望將汽車智能化帶到一個前所未有的高度。前景固然美好,但AI大模型上車真的會順風(fēng)順?biāo)矗?br>
何為AI大模型?
簡單來說,AI大模型是基于深度學(xué)習(xí)技術(shù)的人工智能模型。通過人工智能技術(shù),使用數(shù)以億計的參數(shù)和計算資源進(jìn)行大規(guī)模、高復(fù)雜度的學(xué)習(xí)和訓(xùn)練,從而實現(xiàn)自然語言處理、圖像識別、語音識別等復(fù)雜任務(wù)。從功能上來看,AI大模型在汽車領(lǐng)域有兩種可能的落地形式。
一類是用于人工智能對話交流,大多數(shù)應(yīng)用在智能座艙。比如此前發(fā)布的百度的文心一言,已有東風(fēng)日產(chǎn)、紅旗、長城以及吉利銀河等近十家車企宣布接入;阿里巴巴也宣布AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進(jìn)行測試等。很多業(yè)內(nèi)人士認(rèn)為,智能座艙在AI大模型的賦能下將有著質(zhì)的提升,尤其將為人機(jī)交互打開新的大門。通過大數(shù)據(jù)的深度“喂養(yǎng)”和自主學(xué)習(xí),車載語音助手可以從任務(wù)型逐步升級為閑聊型,智慧程度更接近真人,且具備情感化,從而推動智能汽車向第三生活空間轉(zhuǎn)變,滿足乘客更深層次的生理和心理需求。而這也符合大多數(shù)用戶對于AI大模型上車的期待,通過AI技術(shù)提升智能座艙內(nèi)語音交互表現(xiàn)。
另一類則與智能駕駛有關(guān)。自從2020年特斯拉將Transformer大模型引入自動駕駛領(lǐng)域中,便打開了AI大模型在自動駕駛領(lǐng)域應(yīng)用的大門。可以說,AI大模型更快速、準(zhǔn)確地解決認(rèn)知和決策問題的能力,為車輛自動駕駛能力的提升提供了核心驅(qū)動力。今年4月,毫末智行發(fā)布了自動駕駛生成式大模型DriveGPT,通過引入駕駛數(shù)據(jù)建立 RLHF(人類反饋強化學(xué)習(xí))技術(shù),對自動駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,終極目標(biāo)是實現(xiàn)端到端自動駕駛。百度自動駕駛業(yè)務(wù)部總經(jīng)理陳卓認(rèn)為,AI技術(shù)加速了自動駕駛規(guī)模落地,自動駕駛是人工智能的典型應(yīng)用場景。
AI大模型有望重塑智能汽車
現(xiàn)階段,以智能化、電動化為顯著特征的新汽車正在重塑人們的駕駛與出行體驗,汽車已經(jīng)不單純是出行工具,而是具有交互主體多、交互方式多、計算零件多、數(shù)據(jù)規(guī)模大,以及空間屬性和社會屬性等特征,而這些正是AI大模型最適合的應(yīng)用場景。中國工程院院士、清華大學(xué)教授、國家智能網(wǎng)聯(lián)汽車創(chuàng)新中心首席科學(xué)家李克強認(rèn)為,AI大模型在處理文本、獲取和加工數(shù)據(jù)、建立場景的訓(xùn)練和迭代方面的優(yōu)勢,將會對人機(jī)交互智能化和智能駕駛方面起到加速推動作用。
相比按鍵、觸屏和手勢控制,通過語音方式完成對車輛軟硬件的控制不僅學(xué)習(xí)成本低,而且在操作時手也不用離開方向盤,安全性也要更高。但從近兩年的客戶端反饋來看,普遍使用率比較低,這其中最主要的原因就是用戶體驗差?,F(xiàn)階段,部分車企對于語音交互技術(shù)掌握的不夠成熟,不僅沒能為用戶帶來更好的智能化體驗,然而平添不少麻煩。此前就有一名汽車大V在社交媒體上抱怨,自己在某款自主新能源車后排休息聽語言類節(jié)目時,車載語音頻繁出錯,誤以為后排有人呼喚它而打斷節(jié)目播放。
AI大模型上車后,對話機(jī)器人可以通過高質(zhì)量的大數(shù)據(jù)持續(xù)訓(xùn)練,從而讓車載語音助手的智慧更加接近真人,在與用戶交互過程中具備情感化。簡單來說,以往的車載語音助手只是單純的執(zhí)行用戶的指令,屬于命令式交互;而在AI大模型的加持下,轉(zhuǎn)變成能和用戶“閑聊”的伙伴,屬于對話式交互。以理想汽車為例,在其車載AI助手“理想同學(xué)”升級搭載了自研的“Mind GPT”認(rèn)知大模型后,人車對話內(nèi)容更加復(fù)雜多樣,包括地點、信息、菜譜等,甚至還可以給你講故事、畫畫等。這背后是數(shù)十TB的原始訓(xùn)練數(shù)據(jù),經(jīng)過精心過濾和去重后,相當(dāng)于具備人類高質(zhì)量知識總和。
另外,AI大模型還可以對用戶大量行為數(shù)據(jù)進(jìn)行分析和學(xué)習(xí),生成更加準(zhǔn)確的用戶畫像,從而能夠理解用戶的喜好、需求和用車行為,提供更具個性化的服務(wù)。比如你和車載語音助手說“我餓了”,它會推薦你常去的餐廳或你喜歡吃的食物等。
除了能提升車載語音助手的智能化水平外,AI大模型在智能駕駛領(lǐng)域擁有更多的落地場景。華泰證券在研報中指出,GPT大模型有望賦能垂直領(lǐng)域智能駕駛感知標(biāo)注、決策推理等核心環(huán)節(jié),加速智駕落地。
AI大模型的自學(xué)習(xí)算法能力在汽車駕駛過程中發(fā)揮的關(guān)鍵作用主要體現(xiàn)在感知和決策層面。就感知層面而言,以往自動駕駛感知使用的都是各個小模型“堆疊”的方式,識別的原理就是自己先看,然后去知識庫里比對,如果以往沒有學(xué)習(xí)過,那就無法準(zhǔn)確識別出來。這種方法對于感知能力的提升是有限的,因為路況的變化是日新月異的。此前特斯拉高速撞上側(cè)翻的白色貨車,就有可能是將側(cè)翻的車廂誤判為是天空或者強反光地面。而有了AI大模型的加入后,可以在有限的標(biāo)注數(shù)據(jù)前提下,找到相似障礙物之間的相關(guān)性。有了這個認(rèn)知后,在遇到新的物體時,大模型可以對比這個物體與之前所認(rèn)識到共性,由此判斷是否是個障礙物。
目前,自動駕駛的數(shù)據(jù)來源主要有真實數(shù)據(jù)、虛擬仿真和影子模式。其中虛擬仿真在AI技術(shù)的加持下,可大量合成虛擬場景以用于模型訓(xùn)練和測試,從而提高自動駕駛技術(shù)精度以及自動感知泛化能力,帶來更安全、可靠的駕駛體驗。
此外,AI大模型具備對海量數(shù)據(jù)的處理能力以及多維度分析能力,可以通過分析駕駛行為數(shù)據(jù)來訓(xùn)練自動駕駛控制系統(tǒng)。特別是在決策層面,高等級自動駕駛的認(rèn)知決策需要更加智能化和人性化,AI大模型加入后,傳統(tǒng)的決策規(guī)劃方法將從基于規(guī)則向基于自學(xué)習(xí)的決策智能方向發(fā)展,可以讓車輛更加聰明地處理復(fù)雜場景。同時,基于海量數(shù)據(jù)處理的分析能力,幫助汽車準(zhǔn)確識別和預(yù)測交通情況,并實時提供個性化出行服務(wù),優(yōu)化出行效率。
AI大模型上車充滿挑戰(zhàn)
拋開汽車而言,AI大模型本身也是一個相當(dāng)燒錢的項目,雖然現(xiàn)階段”百模大戰(zhàn)”將市場烘托的一片紅火,但部分投資圈人士表現(xiàn)的卻十分謹(jǐn)慎,認(rèn)為最終勝出的企業(yè)不超過2個。而對于AI大模型上車,雖然目前已經(jīng)有了一些成果出現(xiàn),但想要達(dá)到深層次的結(jié)合,面臨的不確定因素還有很多,包括算法、算力和數(shù)據(jù)支持,以及安全性、法律法規(guī)等方面,還有很長的路要走。中國工程院院士、清華大學(xué)教授、國家智能網(wǎng)聯(lián)汽車創(chuàng)新中心首席科學(xué)家李克強認(rèn)為,目前汽車領(lǐng)域?qū)τ诖竽P偷膽?yīng)用還處于初期的嘗試階段,后續(xù)仍需基于云平臺進(jìn)行打通,向深層領(lǐng)域應(yīng)用推進(jìn)仍然任重道遠(yuǎn)。
AI大模型上車,首當(dāng)其沖要面臨的就是數(shù)據(jù)隱私和安全問題。人工智能的不斷成長,在為我們?nèi)粘S密嚿顜肀憷耐瑫r,也存在數(shù)據(jù)隱私泄露的風(fēng)險。AI大模型訓(xùn)練需要非常龐大的數(shù)據(jù)量,投喂的數(shù)據(jù)越多,車輛也會變得更聰明,輸出的信息也會更加準(zhǔn)確。但這個數(shù)據(jù)投喂過程中,大量車主信息被記錄,比如圖像、聲音、行為特征,以及其他一些敏感隱私信息。一旦遭遇黑客攻擊,在大數(shù)據(jù)分析下,通過圖像、聲音等信息比對就可以獲取到更多的車主隱私信息。前一段時間特斯拉就被曝出數(shù)據(jù)泄露丑聞,特斯拉員工通過內(nèi)部消息系統(tǒng),私下分享車主攝像頭記錄的隱私視頻和圖像。所以在AI大模型與汽車深層次結(jié)合前,首先要解決的就是數(shù)據(jù)隱私安全問題。
其次,硬件配置問題。AI大模型的運行需要高規(guī)格的硬件配置支持,需要具備高算力、大容量內(nèi)存以及低時延的特性。但現(xiàn)階段車載設(shè)備的硬件水平雖然有所提升,但還無法達(dá)到支撐AI大模型運行的水平。以自然語言處理(NLP)的預(yù)訓(xùn)練模型GPT-3為例,需要數(shù)萬億次TOPS的計算能力,這就要求芯片的算力至少要在萬級TOPS以上才能夠勝任計算工作。但從目前的車載硬件部署來看,即便目前蔚來、理想等造車新勢力使用的英偉達(dá)Orin X芯片,單顆算力也僅為254TOPS,這已經(jīng)是目前量產(chǎn)車中算力最高的芯片,遠(yuǎn)遠(yuǎn)達(dá)不到大模型的計算要求。
所以,要想為AI大模型提供海量算力,現(xiàn)階段最好的辦法就是通過云計算來實現(xiàn),但這其中有涉及到通信的問題。在千億、萬億參數(shù)規(guī)模的大模型訓(xùn)練過程中,通信的占比最大可達(dá)50%,傳統(tǒng)的網(wǎng)絡(luò)帶寬遠(yuǎn)遠(yuǎn)不夠,這就會造成網(wǎng)絡(luò)堵塞,出現(xiàn)時延問題。但你想過沒有,如果這個AI大模型應(yīng)用在自動駕駛領(lǐng)域,哪怕只有一點點的通信時延,那就有可能在公路上造成無法挽回的悲劇。
而提到高算力、云計算和高速網(wǎng)絡(luò),這些又都與成本掛鉤。據(jù)普超資本微信公眾號顯示,GPT-3訓(xùn)練成本預(yù)計在500萬美元/次。當(dāng)然,GPT-3還只是OPEN AI在2020年推出的模型。如今到GPT-4,參數(shù)相較GPT-3呈百倍增長,那所需花費的成本勢必要以億美元為單位了。因此AI大模型也只有那些科技巨頭能玩的轉(zhuǎn),其他中小企業(yè)只能是花錢來使用。對于車企而言,即便未來通過與科技巨頭的合作實現(xiàn)AI大模型與汽車深度融合,后期隨著大模型的數(shù)據(jù)規(guī)模不斷增長,訓(xùn)練算力提升,所需花費的成本也不是小數(shù),而且還是持續(xù)性的投入。
另外,AI大模型上車還面臨著道德與法規(guī)的問題。AI系統(tǒng)在某些情況下有可能會做出自主決策,這就會引發(fā)道德選擇問題。其實這也是一個老生常談的問題,現(xiàn)在看還沒有得到解決。比如,在自動駕駛汽車中,面臨不可避免的撞擊事故時,是優(yōu)先避免撞到老年人,還是年輕人,亦或是優(yōu)先避免撞到女人,還是男人等,如何決策成為一個道德困境。另外,目前國內(nèi)暫時還沒有針對AI大模型的數(shù)據(jù)采集使用、數(shù)據(jù)安全以及生成內(nèi)容使用權(quán)等方面的法律法規(guī)。好消息是, 國家網(wǎng)信辦已經(jīng)于今年4月起草了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,但具體何時能夠落地目前還是個未知數(shù)。
總結(jié):
不可否認(rèn),AI大模型的到來為智能汽車的未來發(fā)展帶來更多可能,開啟了汽車領(lǐng)域的新賽道。但就現(xiàn)階段而言,AI大模型在汽車領(lǐng)域的應(yīng)用還存在太多不確定性,無限的想象何時能夠落地,還有待時日。
來源:車質(zhì)網(wǎng)
作者:李豐
本文地址:http://ewshbmdt.cn/news/qiye/206379
以上內(nèi)容轉(zhuǎn)載自車質(zhì)網(wǎng),目的在于傳播更多信息,如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動網(wǎng)(ewshbmdt.cn)立場。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。