繼極越 01 的 1.3.1 版本官宣 OCC 占用網(wǎng)絡(luò)上車后,緊隨而至的 1.4.0 版本又更近一步地釋放了極越這套以視覺為主的智駕能力。廢話不多說,多說不廢話,就讓我們一起快速以圖文形式體驗下極越 1.4.0 版本更新了哪些內(nèi)容吧。
介紹這篇章節(jié)前,需要提出一個靈魂問題:什么是占用網(wǎng)絡(luò)?
在智能化浪潮的洗禮下,我們對于 BEV 有著初步的理解,而在 BEV+transformer 為車輛還原現(xiàn)實世界的基礎(chǔ)上,特斯拉在 2022 年提出了有關(guān)自動駕駛車輛的一種基于視覺能力的全新算法——Occupancy Networks,直譯為占用網(wǎng)絡(luò)。
這套算法的目的在于解決在 3D 空間網(wǎng)絡(luò)中所識別到的異型障礙物,原理則是通過“堆方盒子”的概念,也就是將現(xiàn)實世界中的物體用 3D 像素方塊堆疊還原,從而表達出檢測的物體。
占用網(wǎng)絡(luò)就像一個可以無限伸展的魔方,只需要知道前方是否有方塊堆疊阻擋智駕系統(tǒng)規(guī)劃的行車路線,不在乎它所檢測的對象是什么,也不需要像以往矩形框識別標注般依賴訓(xùn)練,這意味著智駕研發(fā)團隊能夠解放這部分數(shù)據(jù)標注的精力,去進行更多的能力拓展。
而在 1.4.0 的極越 01 上,極越的智駕團隊就為我們帶來了這么一個小彩蛋——呼喚 SIMO 開啟 OCC ,中控屏幕上的 SR 畫面便會“咻”的一下進入 OCC 3D 地圖網(wǎng)絡(luò)當中,除了本車以外所有的地圖信息都會進行方格化重繪,頗有種《我的世界》和樂高的結(jié)合感。
正在加載 視頻播放器。 播放視頻 播放 靜音 當前時間 0:00 / 時長 0:00 加載完成: 0% 0:00 媒體流類型 直播 嘗試直播,當前為延時播放 直播 剩余時間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開對話窗口。Escape鍵將取消并關(guān)閉對話窗口
文字 Color 白黑紅綠藍黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無浮雕壓低均勻下陰影 字體庫 比例無細體單間隔無細體比例細體單間隔細體舒適手寫體小型大寫字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對話窗口
極越 01 實時 OCC 3D 地圖網(wǎng)絡(luò)演示但畢竟是作為彩蛋項目存在,這些未做標注的通用障礙物雖然會隨著硬件實時感知進行實時刷新,但在刷新率上卻并不和底層的地圖道路模型同步,導(dǎo)致實際體驗中畫面會有股割裂感。
不過這種類似入侵后臺讀取數(shù)據(jù)的極客操作畫面,嗯……倒也符合極越“汽車機器人”的身份。
在 OCC 占用網(wǎng)絡(luò)全面上車的情況下,極越 01 的智能駕駛能力又會得到怎樣的提升呢?我們選取了深圳羅湖中心附近的道路進行體驗,如果用一個詞涵蓋極越 01 在 OTA 之后的表現(xiàn),那我想穩(wěn)定二字是最合適不過的。
(P.S. 下文中有關(guān)智能駕駛的部分均為在深圳及周邊地區(qū)體驗,能力或與推送升級后的部分地區(qū)有所差異。)
在第一幕中,可以看到這個 T 型路口由于右邊的施工圍欄,導(dǎo)致整個待行區(qū)域集體左移形成了異形路口,同時地面標線也顯得較為無序,還有著對向右轉(zhuǎn)車輛的干擾。
而在其中的極越 01 得益于 OCC 能力上車,SR 界面完整識別到了施工圍欄,車輛路線規(guī)劃也做出了相應(yīng)調(diào)整,從而順利完成這趟異形路口的無保護左轉(zhuǎn)操作。
正在加載 視頻播放器。 播放視頻 播放 靜音 當前時間 0:00 / 時長 0:00 加載完成: 0% 0:00 媒體流類型 直播 嘗試直播,當前為延時播放 直播 剩余時間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開對話窗口。Escape鍵將取消并關(guān)閉對話窗口
文字 Color 白黑紅綠藍黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無浮雕壓低均勻下陰影 字體庫 比例無細體單間隔無細體比例細體單間隔細體舒適手寫體小型大寫字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對話窗口
而在第二幕場景中,極越 01 也是精準地識別到路旁的障礙車輛,雖然后續(xù)識別模型有所誤差,但傳遞給決策層后依舊成功地做出了繞行動作,繞開路旁的清掃車輛。
正在加載 視頻播放器。 播放視頻 播放 靜音 當前時間 0:00 / 時長 0:00 加載完成: 0% 0:00 媒體流類型 直播 嘗試直播,當前為延時播放 直播 剩余時間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開對話窗口。Escape鍵將取消并關(guān)閉對話窗口
文字 Color 白黑紅綠藍黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無浮雕壓低均勻下陰影 字體庫 比例無細體單間隔無細體比例細體單間隔細體舒適手寫體小型大寫字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對話窗口
我們都知道百度在 AI 領(lǐng)域的探索十分深入,那作為百度旗下能和 ChatGPT 所抗衡的文心一言,在極越 01 上則是和 SIMO 相互結(jié)合起來——當一個車載語音助手擁有了生成式大模型能力后,能為我們帶來什么?
那當然是能帶來眼前一黑的操作……即使是較為抽象沒有具體實例的問題,在結(jié)合了文心一言后的 SIMO 也能盡可能為大家答疑解惑:
“《人在囧途》里王寶強喝的是什么飲料?”具體拆分這個問題,首先由于提供的是演員真名,SIMO 需要在電影中找到演員對應(yīng)的角色。而后需要判斷語意表達,SIMO 在這方面捕捉到發(fā)令者的語意,是想要知道演員在劇中的一項具體行為,并做出相應(yīng)解釋和動作片段講解,隨后輸出內(nèi)容。
正在加載 視頻播放器。 播放視頻 播放 靜音 當前時間 0:00 / 時長 0:00 加載完成: 0% 0:00 媒體流類型 直播 嘗試直播,當前為延時播放 直播 剩余時間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開對話窗口。Escape鍵將取消并關(guān)閉對話窗口
文字 Color 白黑紅綠藍黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無浮雕壓低均勻下陰影 字體庫 比例無細體單間隔無細體比例細體單間隔細體舒適手寫體小型大寫字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對話窗口
這也意味著車內(nèi)的語音助手擺脫了其作為車控的單一身份,可以就某些有趣的問題與車內(nèi)人員進行一問一答。當然,面對有意思的問答,你也可以選擇將 SIMO 的答案發(fā)送到極越 APP 上。
而在具象化的問題上,SIMO 的車控身份又能與大模型的問答打通——比如“如何打開手套箱”,SIMO 在給出常規(guī)的解答后,還能記憶上下文,完整了解后續(xù)指令里缺失的主語,是控制前面提出的內(nèi)容。
正在加載 視頻播放器。 播放視頻 播放 靜音 當前時間 0:00 / 時長 0:00 加載完成: 0% 0:00 媒體流類型 直播 嘗試直播,當前為延時播放 直播 剩余時間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開對話窗口。Escape鍵將取消并關(guān)閉對話窗口
文字 Color 白黑紅綠藍黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無浮雕壓低均勻下陰影 字體庫 比例無細體單間隔無細體比例細體單間隔細體舒適手寫體小型大寫字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對話窗口
不過需要注意的是,現(xiàn)階段僅有主駕駛位可以觸發(fā)融入大模型后的 SIMO 語音助手,按照官方的說法是為了避免車內(nèi)其他位置的指令對于生成回答的干擾。后續(xù)極越會在 2.0 版本中將會開放全車位置的大模型問答。
在關(guān)于 1.4.0 的更新說明文檔中,“手機可投屏至車機屏幕”只占據(jù)了非常小的板塊。但在實際使用后,我頓悟了……
極越關(guān)于車手互聯(lián)的想法,在現(xiàn)階段顯得如此簡單粗暴——把手機連上車載熱點,啪的一下便能直接將手機畫面投上車機屏幕了,不限品牌,不限操作系統(tǒng),什么適配都不需要。
但這里有個非常匪夷所思的邏輯:車載熱點目前只能靠進入車機投屏應(yīng)用才能打開,而不是直接下拉找到開啟按鈕/右上角信號區(qū)域,開啟入口藏得有點太深了。
雖然在這個版本極越只提供了投屏操作,并且投到車機屏幕后不能觸控/常規(guī)情況都是豎屏……但當我隨手拿出一臺手機,連上熱點就能投屏,這種返璞歸真的操作好像是有那么一點在嘲諷目前封閉的車手互聯(lián)生態(tài)。
而嘗試了幾番后,極越這套投屏其實更像是我們在家中將手機/平板等投屏到電視一樣的操作,投屏的應(yīng)用可以在手機后臺掛起,不影響手機的其他操作。
This is a modal window.
打開對話窗口。Escape鍵將取消并關(guān)閉對話窗口
文字 Color 白黑紅綠藍黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無浮雕壓低均勻下陰影 字體庫 比例無細體單間隔無細體比例細體單間隔細體舒適手寫體小型大寫字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對話窗口
投屏視頻播放效果,此時手機可以掛起投屏應(yīng)用到后臺在我看來,這套投屏還有非常大的空間可以挖掘——在保持多品牌多系統(tǒng)的適配下,如何對更多應(yīng)用和場景進行適配,或許這對于無心插柳的極越來說,在日后也能成為車手互聯(lián)的強有力推動者呢?
常用常新,這一次極越的 1.4.0 OTA 更新,無論是 OCC 占用網(wǎng)絡(luò)的具象化,亦或是融入大模型的語音助手,都給人一種眼前一亮的感覺,“汽車機器人”,正在走上不斷自我優(yōu)化的正確道路上。
而受限于篇幅,部分細節(jié)上的優(yōu)化并未放進文章,后續(xù)我們也希望極越官方能夠繼續(xù)為用戶帶來更好的用車體驗。同時,我們也歡迎大家在新出行極越 01 社區(qū)分享自己 OTA 后的體驗的報告。
來源:第一電動網(wǎng)
作者:新出行
本文地址:http://ewshbmdt.cn/carnews/pingce/223119
以上內(nèi)容轉(zhuǎn)載自新出行,目的在于傳播更多信息,如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動網(wǎng)(ewshbmdt.cn)立場。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。