當(dāng)前,汽車行業(yè)已進(jìn)入“新智能”發(fā)展萌芽期,AI大模型的突破,為汽車的進(jìn)化帶來新的變量。
近日,在中國電動汽車百人會與合肥市人民政府聯(lián)合主辦的“第六屆全球智能汽車產(chǎn)業(yè)大會”上,騰訊智慧出行智能座艙產(chǎn)品經(jīng)理孫玨發(fā)表主題為《大模型時代座艙發(fā)展新思考 ——交互革命讓用車更愉悅》的主題演講,分享了騰訊對于大模型上車的思考與實踐,為用戶提供更智能、更有趣、更高效的新一代AI交互體驗。
大模型為座艙交互體驗帶來“新變量”
汽車已經(jīng)不再局限為交通出行工具,隨著用戶用車時長越來越長,用車場景正在持續(xù)豐富,產(chǎn)生了在車上觀影、午休、K歌、露營等豐富的新場景需求。用戶對用車需求的變化,也讓車企為用戶提供的服務(wù)方式也發(fā)生了質(zhì)的改變,從原本的基礎(chǔ)服務(wù),逐漸轉(zhuǎn)變?yōu)橄蚋鲃印⒏悄芑?、更有新鮮感的服務(wù)方式。
與此同時,大模型技術(shù)的應(yīng)用和發(fā)展,以及大模型帶來的泛化性、通用性能力的解決,也引發(fā)了行業(yè)對新一代人車交互方式的更多思考。
孫玨介紹,尤其大模型Agent的應(yīng)用,能夠提供從感知、控制到?jīng)Q策行動的完整智能化服務(wù)。感知層面,能夠支持多模態(tài)的信息輸入,將視覺、聽覺以及其它車輛感知信號如激光雷達(dá)、慣導(dǎo)、GPS等轉(zhuǎn)化為轉(zhuǎn)化為大模型可理解的表示。控制層面,Agent則能夠基于輸入的內(nèi)容進(jìn)行信息的檢索和行動的規(guī)劃,以及基于對專業(yè)知識理解,對過往的觀察、思考和行為反思、并結(jié)合上下文和過往記憶做進(jìn)一步學(xué)習(xí),對新的環(huán)境進(jìn)行新的決策,并強化對于復(fù)雜語義言外之意的理解。對于一些未知任務(wù),也可以結(jié)合上下文和過往記憶去做進(jìn)一步的學(xué)習(xí),提升泛化能力。而在行動層,則還能夠通過觀察、操作和指引能夠完成一些更復(fù)雜的、更適合當(dāng)前環(huán)境的能力。
今年9月,騰訊混元通用大語言模型正式面向產(chǎn)業(yè)亮相,它可作為汽車行業(yè)大模型服務(wù)的底座,汽車企業(yè)不僅可以直接調(diào)用騰訊混元,也可以將其作為基底模型,為不同業(yè)務(wù)場景構(gòu)建專屬應(yīng)用。
孫玨表示,目前,騰訊搭建了面向智能座艙垂域大模型解決方案,并聯(lián)動騰訊豐富的生態(tài)服務(wù)體系和出行服務(wù)體系,通過大數(shù)據(jù)分析、場景服務(wù)推薦、自然語音交互、用戶行為洞察、智能空間計算等功能,帶給用戶更自然的對話體驗、生成式的交互界面、多樣化的場景編排和更個性化的出行服務(wù)建議等,進(jìn)一步拓展“第三空間”想象空間。
共建座艙垂域大模型,從指令式向主動式交互進(jìn)化
在傳統(tǒng)的人車交互體驗中,更多的是一問一答的“被動式”交互,且需要固定用詞,稍微轉(zhuǎn)變一下用詞,車載語音助手可能就無法識別回答,整體人車交互體驗仍停留在比較初階的階段。
孫玨認(rèn)為,座艙大模型的目標(biāo)和定位,需要從用戶的痛點和體驗的短板出發(fā)做一些能力的進(jìn)階,而不是整個顛覆掉。騰訊專門面向智能座艙領(lǐng)域打造的行業(yè)大模型,在應(yīng)用層核心實現(xiàn)兩大模塊的能力,一個是智能的會話管理,另一個則是AI驅(qū)動的UI界面。
在智能會話管理方面,復(fù)雜的任務(wù)規(guī)劃、個性化的問答、知識的獲取、AIGC的分享等,都屬于智能會話范疇。而基于AI驅(qū)動的UI界面,可以給予多模態(tài)的輸入,通過觸控、語音、按鍵、手勢等等各種各樣的應(yīng)用,進(jìn)行多模態(tài)的輸出,豐富人車交互手段。大模型應(yīng)用讓人車交互方式從問答變成問詢,從被動轉(zhuǎn)為主動。同時,除語音和語音外,還可以實現(xiàn)語音和觸控形成上下文、語音和記憶形成上下文等新形式的交互方式。
大模型的應(yīng)用可以顯著提升上下文理解、長尾問答的能力。通過一些思維鏈給到大模型更多的輸入,讓它能夠產(chǎn)生更加符合當(dāng)下理解的判斷?;诖竽P停Z音助手不但能夠更準(zhǔn)確的理解長句子、意向性表達(dá),還支持上下文的主題式聊天,并可結(jié)合用戶反饋進(jìn)行動態(tài)適應(yīng),具備知冷暖的共情能力,提供更符合語言邏輯、表達(dá)通順、能夠激發(fā)用戶共鳴的聊天體驗。即使非??谡Z化的任務(wù)指令,語音助手也能夠很好的進(jìn)行識別并執(zhí)行,比如小孩睡著了、周六是我的生日等。
此外,大模型也能夠提升用車助手的知識問答體驗?;诖竽P蛯ξ臋n的理解、知識的歸納和總結(jié),新一代用車管家能夠提供企業(yè)級/車輛級大模型知識生成和問答,對話構(gòu)建成本下降65%,復(fù)雜問題解決率提升85%。升級后的用車管家在口語化、多輪、長文案的歸納上都有一個質(zhì)的提升,給到用戶的不再是一個長篇大論,而是一個非常精準(zhǔn)的解釋。
在出行規(guī)劃方面,可利用大模型在任務(wù)規(guī)劃、復(fù)雜任務(wù)生成的優(yōu)勢,針對出行場景提供景點介紹、美食推薦、路線規(guī)劃等智能任務(wù)編排能力,實現(xiàn)真正的服務(wù)找人,讓旅途更愉悅。同時,騰訊還在探索軟件、硬件和手機端的綜合聯(lián)動,為用戶提供全場景貫穿式服務(wù)。
孫玨表示:“大模型時代,智能座艙需要更豐富的核心生態(tài)以及出行服務(wù),幫助車企實現(xiàn)服務(wù)化的轉(zhuǎn)型。同時也需要通過大模型,打造更便捷的交互方式、更沉浸的多變空間,為用戶提供更加愉悅的用車體驗。”
來源:第一電動網(wǎng)
作者:程雯
本文地址:http://ewshbmdt.cn/kol/211458
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。