1月17日,格靈深瞳聯(lián)合創(chuàng)始人CEO何搏飛在“2015極客公園創(chuàng)新大會(huì)”上表示,2015年是自動(dòng)駕駛的元年,因?yàn)?a class='link' target='_blank'>奔馳、寶馬、尼桑,幾乎所有的車廠都在今年發(fā)布了自家自動(dòng)駕駛汽車的計(jì)劃。很多車廠宣稱在2020年也就是五年以后,他們的自動(dòng)駕駛汽車就會(huì)跑在大街小巷。而這些得以實(shí)現(xiàn)最大的障礙和挑戰(zhàn)只有一個(gè),那就是計(jì)算機(jī)視覺。
何搏飛解釋了為什么計(jì)算機(jī)視覺是實(shí)現(xiàn)自動(dòng)駕駛最大障礙的原因。他說,控制汽車的方向盤、油門、剎車,這些事情簡(jiǎn)單的傳感技術(shù)就可以解決,甚至如果是純電動(dòng)車的話,可能一個(gè)軟件就可以解決。告訴汽車,從A到B你的目的地在哪,GPS就可以解決。但是,面對(duì)路上發(fā)生的一切,特別是現(xiàn)在自動(dòng)擋的車,要把車開起來非常容易,開車真正難的是如何應(yīng)對(duì)路上各種復(fù)雜的狀況,而這些需要的就是視覺的感知能力。“我們想一想,如果沒有視覺感知,你如何知道前面有行人在穿越馬路,一切一切要實(shí)現(xiàn),必須要依靠計(jì)算機(jī)視覺。”
何搏飛認(rèn)為,自動(dòng)駕駛汽車,將會(huì)是第一個(gè)真正被人類大規(guī)模使用,并且對(duì)人類生活產(chǎn)生顛覆性影響真正意義上的機(jī)器人。因?yàn)?,?dāng)汽車可以自動(dòng)駕駛的時(shí)候,它對(duì)我們來說才是一個(gè)真正智能不需要人為干預(yù)的機(jī)器人。
另外,在何搏飛看來,未來的人工智能將把我們的大腦都徹底解放出來,讓人自由自在地做有創(chuàng)造性、有創(chuàng)造力的事情。
[page]
以下為何搏飛的演講實(shí)錄:
大家好!“Vision”這個(gè)單詞在任何一本英漢詞典里,第一條解釋就是視覺,視覺是什么?視覺是一種感知能力。我們?nèi)松砩弦还灿形宸N感知能力,包括視覺、聽覺、嗅覺、味覺和觸覺。
余凱博士剛才講到人工智能的本質(zhì)就是自主學(xué)習(xí)的能力。我們?nèi)说拇竽X之所以這么聰明,這么復(fù)雜,這么高級(jí),就是因?yàn)槲覀內(nèi)丝梢宰灾鞯貙W(xué)習(xí),而自主學(xué)習(xí)能力主要源自這五種感知能力。
這五種感知能力中,我們大腦所接收的80%的信息都來自視覺,我問大家一個(gè)問題,如果我們不得不放棄四種感知能力,只保留一種,你會(huì)保留哪一種?
我相信在座的很多人答案跟我一樣,你會(huì)保留視覺信息。大家有沒有想過為什么?我們都知道有這樣一個(gè)數(shù)據(jù),我們的大腦分成兩半,左腦和右腦,左腦是理性,右腦是感性的,是有創(chuàng)造力的。
還有一個(gè)數(shù)據(jù)可能大家并不知道,我們大腦有接近一千億個(gè)神經(jīng)元,絕大多數(shù)只做一件事情,就是處理我們的視覺信息。大家想想當(dāng)我們休息時(shí),會(huì)做什么,通常會(huì)閉上我們的眼睛,所以每一天當(dāng)我們的眼睛睜開時(shí)我們?cè)谥鲃?dòng)或者被動(dòng)地接受大量的復(fù)雜信息。
大家知道,我們?nèi)祟愔饕峭ㄟ^學(xué)習(xí)來成長(zhǎng),智慧也是在這樣的過程中提高。那么分享知識(shí)就非常重要。從幾千年前開始我們?nèi)祟惥桶盐淖志庉嫵蓵?。但文字承載的信息量是有限的,我們還希望它更加的豐富多彩。
所以到了100多年前有了電話,我們可以遠(yuǎn)距離的讓聽到我們的聲音,后來我們就了廣播,終于幾十年前我們有了電視,到了十年前最近這段時(shí)間大家知道在網(wǎng)絡(luò)帶寬成為可能的情況下視頻網(wǎng)站才成為可能。
為什么從文字,到聲音,到視頻,一步一步到幾千年前,到最近幾年,才能隨時(shí)隨地的分享動(dòng)態(tài)的畫面視頻?沒有其他原因,就是因?yàn)閯?dòng)態(tài)的視覺信息是最豐富的,也是最復(fù)雜的。
當(dāng)我們討論人工智能,討論計(jì)算機(jī)、機(jī)器是否有學(xué)習(xí)能力時(shí),我們首先要問自己一個(gè)問題,那就是機(jī)器有視覺嗎?我必須要這樣講,在今天絕大多數(shù)場(chǎng)合下,對(duì)我們絕大多數(shù)人來說,機(jī)器是沒有視覺的,機(jī)器是瞎子。
你們可能會(huì)反對(duì)我,會(huì)說我在用手機(jī)拍照,我的電腦上也有攝像頭,大街小巷有這么多攝像頭,難道它們不都是機(jī)器的眼睛嗎?難道這不是視覺嗎?但是大家想一想,當(dāng)我們拍了這些照片視頻,最終計(jì)算機(jī)看懂這些視頻照片了嗎?
我們把它存下來,不管是單反相機(jī)、攝像機(jī),拍完以后,最終還是要人處理這些信息。為什么?因?yàn)樵诮^大多數(shù)情況下,電腦是無法處理這種復(fù)雜信息的。
機(jī)器視覺給予我們一個(gè)更加互動(dòng)的世界
但今天我也要告訴大家,實(shí)際上在很多領(lǐng)域,機(jī)器視覺已經(jīng)在改變我們的生活。當(dāng)我說到這兒時(shí),可能很多人馬上會(huì)想到的第一件事情是微軟的體感游戲,當(dāng)你做各種動(dòng)作時(shí)它會(huì)理解你的行為,配合多媒體的體驗(yàn),你會(huì)感受到互動(dòng)和豐富的感受。
所以,當(dāng)機(jī)器有視覺的時(shí)候,首先帶給我們的就是一個(gè)更加互動(dòng)的世界。在這兒我給大家看一段特別有意思的視頻,我的朋友黃沙,就用微軟的這個(gè)傳感器拍了一段動(dòng)感的視頻。
我們知道,好萊塢電影和美劇在制作過程中會(huì)有一個(gè)綠色的背景,它就是做一件事情,就是把人和背景區(qū)分開,這樣后期制作時(shí),就可以把綠色背景換成任何的場(chǎng)景,但有了三維計(jì)算機(jī)視覺,任何在座的每個(gè)人都能超越好萊塢特效師,更好地完成精彩的動(dòng)畫,這只是個(gè)簡(jiǎn)單的例子。
機(jī)器視覺帶給我們一個(gè)更加健康的世界
當(dāng)機(jī)器有了視覺以后,還會(huì)給我們帶來一個(gè)更加健康的世界。舉個(gè)例子,在我們做心臟手術(shù)時(shí)有一件特別痛苦的事。大家知道,人的心臟是唯一不能夠被麻醉藥麻痹使它靜止的器官,只要人活著心臟就會(huì)不停的跳動(dòng),在跳動(dòng)的心臟上做手術(shù)難度是非常大的。
所以,很多時(shí)候當(dāng)要對(duì)心臟做手術(shù)的時(shí)候,醫(yī)生做的第一件事情就是通過醫(yī)學(xué)的手段讓心臟停止跳動(dòng),然后用最短的時(shí)間做完手術(shù)再讓心臟重新起搏,但將有30%心臟將會(huì)永遠(yuǎn)不能再跳動(dòng)起來。但如果有一種技術(shù)使醫(yī)生在跳動(dòng)的心臟上做手術(shù)將會(huì)挽救很多人的人。
大家想一下,人的心臟跳動(dòng)是非常有規(guī)律的,如果手術(shù)刀可以跟心臟同頻率振動(dòng),醫(yī)生通過攝像頭看到的就是相對(duì)靜止的心臟,那時(shí)動(dòng)手術(shù)就相當(dāng)于在靜止的心臟上做手術(shù)。
這個(gè)畫面上,白色的網(wǎng)格就是要做手術(shù)的區(qū)域,通過計(jì)算機(jī)深度視覺,已經(jīng)把它穩(wěn)定下來了。心臟手術(shù)很多人看了可能會(huì)不舒服,所以我們做了這樣一個(gè)演示,醫(yī)生給葡萄剝皮,這在國(guó)外已經(jīng)應(yīng)用了,我相信不會(huì)很久中國(guó)也會(huì)應(yīng)用。
機(jī)器視覺創(chuàng)造一個(gè)更加便捷的世界
剛才余凱博士也談到了自動(dòng)駕駛汽車,大家想一想,當(dāng)自動(dòng)駕駛這一天來臨時(shí),我們將有一個(gè)更加便捷的世界。各位極客可能對(duì)剛剛過去的2015美國(guó)電子消費(fèi)展CES有更深刻的印象。
除了智能硬件以外,應(yīng)該說2015年是自動(dòng)駕駛的元年。奔馳、寶馬、尼桑,幾乎所有的車廠都在今年推出了自己自動(dòng)駕駛汽車的計(jì)劃,很多車廠宣稱在2020年,就是五年以后,他們的自動(dòng)駕駛汽車就會(huì)跑在大街小巷。
我在這里有個(gè)判斷,我個(gè)人覺得,自動(dòng)駕駛汽車,將會(huì)是第一個(gè)真正被人類大規(guī)模使用,且對(duì)人類生活產(chǎn)生顛覆性影響,真正意義上的機(jī)器人。因?yàn)楫?dāng)汽車可以自動(dòng)駕駛時(shí),它對(duì)我們來說才是一個(gè)真正智能,不需要人為干預(yù)的機(jī)器人。
大家可能都看到過左邊這輛汽車,它其實(shí)就是Google的無人駕駛汽車。Google應(yīng)該說是到現(xiàn)在為止全世界第一個(gè)讓自動(dòng)駕駛汽車在人類的公路上行駛超過100萬公里的公司。
我曾經(jīng)跟Google無人駕駛汽車負(fù)責(zé)人聊過,當(dāng)時(shí)我開了個(gè)玩笑,你們Google自動(dòng)駕駛汽車業(yè)只敢在美國(guó)這樣的城市測(cè)試,敢來北京測(cè)嗎?他當(dāng)時(shí)告訴我,無人駕駛汽車這件事情要成功,最大的障礙和挑戰(zhàn)只有一個(gè),那就是計(jì)算機(jī)視覺。
大家想一想,控制汽車的方向盤、油門、剎車,這些事情簡(jiǎn)單的傳感技術(shù)就可以解決,甚至如果是一個(gè)純電動(dòng)車的話,可能一個(gè)軟件就可以解決。告訴汽車,從A到B你的目的地在哪,這件事情GPS就可以解決。
但面對(duì)路上發(fā)生的一切,可能很多人也學(xué)過,所以大家都知道,特別是現(xiàn)在自動(dòng)擋的車,要把車開起來非常容易,開車真正難的是如何應(yīng)對(duì)路上各種復(fù)雜的狀況,而這些需要的就是視覺的感知能力。我們想一想,如果沒有視覺感知,你如何知道前面有行人在穿越馬路,必須要依靠計(jì)算機(jī)視覺。
大家可能也知道,格靈深瞳是把計(jì)算機(jī)視覺技術(shù)應(yīng)用在監(jiān)控領(lǐng)域的公司,為什么到處有這么多攝像頭,連接到監(jiān)控中心,有很多人盯著它看,為什么還需要計(jì)算機(jī)視覺,我們需要人工智能做這么多事兒?jiǎn)幔?
我在這里給大家假象一個(gè)場(chǎng)景,如果讓你在你自己家里,你在看電視,比如時(shí)下特別熱門的一部電視劇,在很認(rèn)真的看,這時(shí)又把ipad擺在前面觀看意甲聯(lián)賽,同時(shí)你的朋友還在給你發(fā)微信,三個(gè)屏幕。
我跟你打個(gè)賭,給你10分鐘時(shí)間,10分鐘以后我隨機(jī)考你這三個(gè)屏幕的內(nèi)容,我相信在座很少有人跟我賭,為什么?因?yàn)槿齻€(gè)屏幕展示的東西動(dòng)態(tài)畫面的時(shí)候,對(duì)人來說信息太復(fù)雜了。
但想一想,安保中心監(jiān)控室面對(duì)的是這樣一個(gè)屏幕,我看了很多美劇電影,有那么多高端技術(shù),我可以告訴大家,我曾經(jīng)參觀過拉斯維加斯所有大賭場(chǎng)后臺(tái)的監(jiān)控中心,跟中國(guó)任何一家普通銀行的監(jiān)控中心沒有任何區(qū)別,都是這樣一個(gè)大屏幕,幾個(gè)人盯著這個(gè)屏幕在看。
我自己在監(jiān)控中心呆過可能超過100個(gè)小時(shí),我當(dāng)時(shí)去的時(shí)候正好是世界杯期間,保安們大多數(shù)在玩兒手機(jī)、看球賽,但相信我,如果讓你們?nèi)ィ@不是職業(yè)道德的問題,人類是有極限的,當(dāng)人盯著這樣一個(gè)大屏幕看,超過10分鐘時(shí),說實(shí)話你其實(shí)跟什么都沒看一樣。
所以大家想象一下,現(xiàn)在屏幕上所顯示的一共是10個(gè)大屏,每個(gè)大屏16宮格,也就是160路視頻。北京機(jī)場(chǎng)就有幾萬路視頻,也就是說,如果把每一路視頻放一分鐘把這些視頻輪一遍,就需要5萬個(gè)小時(shí)。所以,發(fā)生事情能看到嗎?
每時(shí)每刻,每一路視頻我們都把它存下來,最后我們當(dāng)證據(jù)用。是的,但你想一想,這么多路視頻無時(shí)不刻都在存,全世界每賣出兩塊視頻,其中有一塊就是賣給安防監(jiān)控視頻的。當(dāng)有這樣海量數(shù)據(jù)的時(shí)候,人類如何處理?
所以大家想象一下,如果我們可以把每個(gè)攝象頭,都換成一個(gè)智慧像小機(jī)器人一樣幫我們盯著,當(dāng)發(fā)生問題的時(shí)候就可以第一時(shí)間預(yù)警。所以,當(dāng)我們的機(jī)器有了視覺的時(shí)候,我相信大家都能夠看到,我們的世界會(huì)變得更好。
但是當(dāng)世界變得更好時(shí),我們?nèi)藭?huì)變成什么樣呢?可能你會(huì)說人會(huì)變得更高、更快、更強(qiáng),那是奧林匹克精神,其實(shí)在我看來,我個(gè)人覺得我們?nèi)说脑竿?,其?shí)一開始就跟更高、更快、更強(qiáng)是相反的,我們有時(shí)候經(jīng)常說越是說什么越是代表不具備什么。
我自己有個(gè)觀點(diǎn),我總覺得,人類從一開始所有技術(shù)進(jìn)步的唯一源動(dòng)力,就是把自己解放出來,或者說的更直白一點(diǎn),就是讓自己變得更懶。
今天有很多服務(wù)都可以上門,O2O上門美甲、洗車,所有事情都是把人類解放出來。每次重大的技術(shù)革命,比如17世紀(jì)的蒸汽機(jī)革命,19世紀(jì)的電力革命,近代的信息革命。工業(yè)革命發(fā)生以后,機(jī)器可以開始取代人類做一些簡(jiǎn)單的體力勞動(dòng),我們的四肢被解放出來,去到一個(gè)地方不再需要走路去,可以坐車去。
隨著電力革命、信息革命,到今天大腦一部分功能都已經(jīng)被計(jì)算機(jī)所替代。比如我們要去做運(yùn)算的時(shí)候,我們可以用計(jì)算器,電腦、手機(jī)也可以幫助我們記憶、存儲(chǔ)。
但是我覺得,這就是為什么我總覺得,人工智能這件事情一定會(huì)實(shí)現(xiàn),因?yàn)閺臐撘庾R(shí)里,人一定會(huì)不懈的朝著這個(gè)方向努力,因?yàn)閷?duì)人來說,最終最難被解放的兩個(gè)器官,一個(gè)是眼睛、一個(gè)是大腦。
也曾經(jīng)有人問我說,大家可能也都知道,馬斯特和霍金都對(duì)人工智能發(fā)表了很多威脅論,人工智能成熟以后是不是有很多人會(huì)失業(yè)?
我對(duì)這個(gè)問題是這么看的。技術(shù)變革時(shí),都會(huì)迫使我們做更有創(chuàng)造力、更高級(jí)的事情。舉個(gè)例子,比如農(nóng)民工進(jìn)城,過去做農(nóng)活這是個(gè)相對(duì)來說更加簡(jiǎn)單的體力勞動(dòng),而當(dāng)這樣的體力勞動(dòng)被機(jī)械化所替代時(shí),我們的農(nóng)民工來到城里,他們做了泥瓦匠、水電工、月嫂,他們掙的錢比我們很多人都多。
而未來人工智能替代人做更多事情時(shí),人會(huì)逼迫做更高級(jí)的事情。而人能做什么呢?去交流、去分享、去進(jìn)步、最終去進(jìn)化。所以人做的所有事情,最終就是想實(shí)現(xiàn)一件事情,那就是人工智能,把我們的大腦徹底解放出來,讓人自由自在地做有創(chuàng)造性的事。
今天我們這個(gè)論壇的主題叫X論壇,“Vision”這個(gè)詞的第二條解釋是“遠(yuǎn)見”,也就是在未看見的時(shí)候,就能通過想象力看到未來。今天我希望大家在一起分享,能跟我一樣,看見未來其實(shí)就在我們眼前。謝謝!
來源:第一電動(dòng)網(wǎng)
作者:李艷嬌
本文地址:http://ewshbmdt.cn/news/shichang/36965
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。