人工智能

假如路上跑的不是汽車(chē)，而是阿爾法狗？

第一電動(dòng)大牛作者夏珩 2016-03-18 06:47

【第一電動(dòng)網(wǎng)】(專(zhuān)欄作者夏珩)為期一周的人機(jī)世紀(jì)大戰(zhàn)最終以谷歌人工智能圍棋手AlphaGo四勝一負(fù)完勝人類(lèi)世界圍棋冠軍李世石9段落下帷幕，引發(fā)了全人類(lèi)對(duì)人工智能的關(guān)注狂潮。 AlphaGo(阿爾法狗)的強(qiáng)勁表現(xiàn)令科技界產(chǎn)業(yè)界為之振奮，而未來(lái)其所代表的人工智能(AI, artificial intelligence)技術(shù)在智能駕駛等領(lǐng)域的發(fā)展則更加讓我們期待。為什么這樣說(shuō)？我們從兩個(gè)方面來(lái)聊一聊。

第一是深度學(xué)習(xí)，從大數(shù)據(jù)中學(xué)習(xí)發(fā)掘規(guī)律。 AlphaGo和李世石對(duì)弈，都是在決定下一個(gè)子落在哪里的問(wèn)題。一個(gè)19*19的棋盤(pán)最多就有了361種選擇。而最終的勝負(fù)是由這幾步、幾十步、甚至上百步?jīng)Q定的。所以圍棋是典型的動(dòng)態(tài)決策系統(tǒng)，每一步都影響了后面的結(jié)局，每下一步我們都不得不去考慮接下來(lái)的幾步應(yīng)該是怎么樣的，這一步落子對(duì)后面有什么影響。這也就是咱們說(shuō)的棋盤(pán)推演。若是由電腦來(lái)做推演，去考慮落子的各種可能性，從中選出最有勝算的一招，那人還有勝算嗎？ 1997年‘深藍(lán)’就是利用類(lèi)似的‘窮舉法’打敗了當(dāng)時(shí)的國(guó)際象棋世界冠軍卡斯帕羅夫。圍棋難就難在它的變化太多，復(fù)雜度太高了，和國(guó)際象棋完全不在一個(gè)數(shù)量級(jí)，就算是讓深藍(lán)用上當(dāng)今最快速的硬件去硬算圍棋的棋盤(pán)推演，深藍(lán)也只能對(duì)你說(shuō)臣妾做不到呀。

人機(jī)世紀(jì)對(duì)決(圖片來(lái)源于網(wǎng)絡(luò))

人比‘深藍(lán)’高明的一點(diǎn)就是棋感。人根據(jù)棋局評(píng)感覺(jué)，而不必做細(xì)致的棋盤(pán)推演，就能大概篩選出一些較好的選擇；對(duì)于走一步之后的局面，人能大概判斷出是贏面大還是輸面大。所以人就避免了窮舉棋盤(pán)推演，只需針對(duì)少量的選擇做些有效的搜索即能做出落子判斷。從決策規(guī)劃的角度考慮，這就好比把一個(gè)動(dòng)態(tài)規(guī)劃的問(wèn)題用近似動(dòng)態(tài)規(guī)劃(ADP)的方法解決了。而對(duì)棋局的簡(jiǎn)單有效的評(píng)估就類(lèi)似ADP中的value function(價(jià)值函數(shù))，落子的傾向性選擇類(lèi)似ADP中的heuristics(試探法)。這種valuefunction和heuristics就是圍棋中的規(guī)律。 AlphaGo的成功就在于它的算法中包含了這兩個(gè)規(guī)律，而不僅僅是野蠻搜索。它的規(guī)律是通過(guò)機(jī)器學(xué)習(xí)獲得的，這就是AlphaGo背后的兩大技術(shù)本質(zhì)：大數(shù)據(jù)和深度學(xué)習(xí)。通過(guò)學(xué)習(xí)幾千萬(wàn)局的對(duì)弈過(guò)程數(shù)據(jù)，訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)中固化了優(yōu)秀棋手的落子傾向和對(duì)局面的判斷能力。這樣在實(shí)時(shí)的人機(jī)對(duì)弈過(guò)程中，其所需要搜索的空間范圍已經(jīng)收縮到一個(gè)可計(jì)算的范圍內(nèi)，最終選定最佳落子。而深度學(xué)習(xí)持續(xù)不斷的學(xué)習(xí)對(duì)弈數(shù)據(jù)，使AlphaGo始終保持進(jìn)步。

二是數(shù)據(jù)、學(xué)習(xí)與互連，讓AI做你的智能駕駛司機(jī)。AlphaGo的勝利只是針對(duì)一個(gè)博弈游戲，但是AlphaGo的算法是通用的機(jī)器學(xué)習(xí)算法，而不是特定于圍棋一種應(yīng)用，所以真正有意義的是人工智能已經(jīng)在影響技術(shù)領(lǐng)域。 AlphaGo經(jīng)過(guò)學(xué)習(xí)打敗了圍棋世界冠軍，那么AI技術(shù)用在汽車(chē)領(lǐng)域呢？人工智能駕駛會(huì)不會(huì)成為世界上最優(yōu)秀的司機(jī)？當(dāng)前不是，但是這個(gè)進(jìn)程已經(jīng)開(kāi)始。

人就是智能駕駛的老師，每天的行駛數(shù)據(jù)(路況，地圖，交通信息，駕駛員的操作)中包含著駕駛和交通的規(guī)律。AI技術(shù)通過(guò)學(xué)習(xí)這些大數(shù)據(jù)就能掌握人所掌握的規(guī)律。特斯拉(Tesla) 的Autopilot 1.01就已經(jīng)具備了學(xué)習(xí)的功能。特斯拉的用戶(hù)們已經(jīng)報(bào)道了他們的汽車(chē)每天的變化，一開(kāi)始不能很好保持在彎道行駛上的特斯拉汽車(chē)，漸漸地學(xué)會(huì)了在彎道上減慢車(chē)速?gòu)亩鴮?shí)現(xiàn)車(chē)道保持。

假如路上跑的不是汽車(chē)，而是阿爾法狗？

小鵬汽車(chē)工程師對(duì)標(biāo)Tesla Model S

而這種學(xué)習(xí)更大的力量在于它可以不僅是一輛車(chē)的學(xué)習(xí)，更可以是所有的特斯拉汽車(chē)的共同學(xué)習(xí)。汽車(chē)已經(jīng)有了互連網(wǎng)絡(luò)的屬性，駕駛數(shù)據(jù)從每一輛汽車(chē)傳輸?shù)皆贫耍?所以是一個(gè)群體去訓(xùn)練同一個(gè)機(jī)器大腦。這一點(diǎn)是比人腦更有優(yōu)勢(shì)的地方，一個(gè)人的學(xué)習(xí)只能依靠自己的數(shù)據(jù)，而機(jī)器學(xué)習(xí)卻能從所有人的數(shù)據(jù)中去發(fā)現(xiàn)規(guī)律，從而有望學(xué)習(xí)到最全面的駕駛規(guī)律，超越每一個(gè)個(gè)體。并且這種學(xué)習(xí)成果的分享性更是人類(lèi)所不能及。云端的AI可推送到每一個(gè)汽車(chē)中，實(shí)現(xiàn)數(shù)據(jù)的閉環(huán)。所以以后的汽車(chē)應(yīng)該是具備本地學(xué)習(xí)能力以及互連群體學(xué)習(xí)的功能。目前能提供這種基礎(chǔ)構(gòu)架的例如NVIDIA發(fā)布的PX2車(chē)載終端，其每秒可進(jìn)行24萬(wàn)億次深度學(xué)習(xí)計(jì)算。我們小鵬汽車(chē)在設(shè)計(jì)之初就考慮了這種需求方向，智能與互連是我們的屬性，汽車(chē)-數(shù)據(jù)-網(wǎng)絡(luò)-后臺(tái)，系統(tǒng)的框架能夠讓AI今后在我們的汽車(chē)上發(fā)揮作用。

機(jī)器學(xué)習(xí)甚至意味著能夠發(fā)現(xiàn)人類(lèi)駕駛數(shù)據(jù)中沒(méi)有包含的規(guī)律。好比AlphaGo通過(guò)左右互搏，產(chǎn)生大量新的對(duì)弈數(shù)據(jù)，通過(guò)加強(qiáng)學(xué)習(xí)(reinforce learning)刺激AlphaGo發(fā)現(xiàn)更優(yōu)的圍棋路數(shù)。在智能駕駛領(lǐng)域，通過(guò)仿真交通場(chǎng)景，讓AI自己去發(fā)現(xiàn)智能駕駛的問(wèn)題與局限，今其產(chǎn)生更好的規(guī)劃、決策和執(zhí)行。

智能駕駛技術(shù)的成熟尚需時(shí)日，正如人工智能技術(shù)本身同樣處于快速發(fā)展中一樣。越來(lái)越多的技術(shù)會(huì)最終應(yīng)用于智能汽車(chē)，通過(guò)學(xué)習(xí)不斷提高駕駛水平，帶來(lái)更加安全更加極致的駕駛體驗(yàn)。

我們的司機(jī)是AI，這一天終會(huì)到來(lái)，我們也會(huì)盡情的享受這種變革給我們帶來(lái)的便利，而不會(huì)再覺(jué)得是被碾壓了。

作者系小鵬汽車(chē)總裁

來(lái)源：第一電動(dòng)網(wǎng)

作者：夏珩

本文地址：http://ewshbmdt.cn/kol/42653

返回第一電動(dòng)網(wǎng)首頁(yè) >

本文由第一電動(dòng)網(wǎng)大牛說(shuō)作者撰寫(xiě)，他們?yōu)楸疚牡恼鎸?shí)性和中立性負(fù)責(zé)，觀(guān)點(diǎn)僅代表個(gè)人，不代表第一電動(dòng)網(wǎng)。本文版權(quán)歸原創(chuàng)作者和第一電動(dòng)網(wǎng)（ewshbmdt.cn）所有，如需轉(zhuǎn)載需得到雙方授權(quán)，同時(shí)務(wù)必注明來(lái)源和作者。

歡迎加入第一電動(dòng)網(wǎng)大牛說(shuō)作者，注冊(cè)會(huì)員登錄后即可在線(xiàn)投稿，請(qǐng)?jiān)跁?huì)員資料留下QQ、手機(jī)、郵箱等聯(lián)系方式，便于我們?cè)诘谝粫r(shí)間與您溝通稿件，如有問(wèn)題請(qǐng)發(fā)送郵件至 content@d1ev.com。

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com（#替換成@）刪除。