蓋世汽車(chē)訊 想象一下有一只橘貓,然后再想象一下這只貓是煤灰色的,現(xiàn)在,再想象一下,這只貓正在長(zhǎng)城上昂首闊步。做出上述想象時(shí),人們大腦中的一系列神經(jīng)元會(huì)快速激活,并根據(jù)之前對(duì)世界的認(rèn)知,想出各種各樣的圖片。換句話(huà)說(shuō),人類(lèi)很容易想象一個(gè)具有不同屬性的物體。但是,盡管深度神經(jīng)網(wǎng)絡(luò)上在執(zhí)行某些任務(wù)是能夠取得與人類(lèi)一樣或超越人類(lèi)的表現(xiàn),但是,計(jì)算機(jī)在“想象”技能方面仍在與人類(lèi)處于較量中。
據(jù)外媒報(bào)道,美國(guó)南加州大學(xué)的一支研究團(tuán)隊(duì)研發(fā)了一種人工智能(AI)技術(shù),能夠利用與人類(lèi)類(lèi)似的能力想象擁有不同屬性、之前從未見(jiàn)過(guò)的物體。該支團(tuán)隊(duì)由Laurent Itti教授、博士生Yunhao Ge、Sami Abu-El-Haija和Gan Xin組成。研究人員表示:“我們受人類(lèi)視覺(jué)泛化能力的啟發(fā),嘗試在機(jī)器中模擬人類(lèi)的想象力。人類(lèi)能夠根據(jù)形狀、姿勢(shì)、位置、顏色等屬性將所學(xué)的知識(shí)分開(kāi),然后再把此類(lèi)知識(shí)結(jié)合起來(lái)想象一個(gè)新的物體。
新AI系統(tǒng)靈感(圖片來(lái)源:南加州大學(xué))
AI的泛化問(wèn)題
例如,假設(shè)你想創(chuàng)建一個(gè)能夠生成車(chē)輛圖片的AI系統(tǒng)。在理想情況下,你能夠?yàn)樵撍惴ㄌ峁┮恍┸?chē)輛的圖片,然后其能夠生成各種顏色、不同角度的各種汽車(chē),如保時(shí)捷、龐蒂亞克、皮卡等。
這也是AI長(zhǎng)期追求的目標(biāo)之一,即創(chuàng)建能夠外推的模型,這也意味著,只要給出一些例子,該模型能夠提取出基本的規(guī)則,并將此類(lèi)規(guī)則應(yīng)用到各種新穎、之前從未見(jiàn)過(guò)的例子中。但是,機(jī)器通常只訓(xùn)練像素等樣本特征,而不會(huì)考慮到物體的屬性。
想象力的科學(xué)
在此次新研究中,研究人員利用一種稱(chēng)為分離(Disentanglement)的概念試圖克服此種限制。例如,分離能夠用于生成深度偽裝(deepfakes),將人類(lèi)的面部運(yùn)動(dòng)和身份分離,然后合成新的圖片和視頻,用另一個(gè)人替代原來(lái)的人,但是還是原來(lái)的面部運(yùn)動(dòng),類(lèi)似于換臉技術(shù)。
新方法訓(xùn)練圖像以及被組合的圖像(圖片來(lái)源:南加州大學(xué))
類(lèi)似上述方法,不像傳統(tǒng)的算法一樣只采用一個(gè)樣本,新方法采用了一堆樣本照片并挖掘兩者之間的相似性,以實(shí)現(xiàn)“可控分離表征學(xué)習(xí)”(controllable disentangled representation learning)。
然后,該方法會(huì)重新組合知識(shí),以實(shí)現(xiàn)“可控新圖像合成”,或者人們所說(shuō)的想象。例如,以變形金剛為例,它能夠采用威震天汽車(chē)的外形,但是采用黃色大黃蜂的顏色和姿勢(shì)以及紐約時(shí)代廣場(chǎng)的背景。最后是一輛黃色大黃蜂顏色的威震天汽車(chē)在時(shí)代廣場(chǎng)行駛,即使在訓(xùn)練過(guò)程中并沒(méi)有人看到此種樣本。
然后,該方法會(huì)重新組合知識(shí),以實(shí)現(xiàn)“可控新圖像合成”,或者人們所說(shuō)的想象。例如,以變形金剛為例,它能夠采用威震天汽車(chē)的外形,但是采用黃色大黃蜂的顏色和姿勢(shì)以及紐約時(shí)代廣場(chǎng)的背景。最后是一輛黃色大黃蜂顏色的威震天汽車(chē)在時(shí)代廣場(chǎng)行駛,即使在訓(xùn)練過(guò)程中并沒(méi)有人看到此種樣本。
理解這個(gè)世界
雖然分離不是一個(gè)新概念,研究人員表示,該框架能夠與幾乎任何類(lèi)型的數(shù)據(jù)或知識(shí)兼容,擴(kuò)大其應(yīng)用范圍。例如,通過(guò)將敏感屬性從等式中移動(dòng),分離種族和性別相關(guān)知識(shí),以實(shí)現(xiàn)更公平的AI。
在醫(yī)學(xué)領(lǐng)域,該技術(shù)能夠通過(guò)將藥物的功能從其他屬性中分離,然后在重新組合以合成新的醫(yī)藥,從而幫助醫(yī)生和生物學(xué)家發(fā)現(xiàn)更有用的藥物。賦予機(jī)器想象力還能夠幫助創(chuàng)造更安全的AI,例如,讓自動(dòng)駕駛汽車(chē)在訓(xùn)練中想象并避開(kāi)之前未看到的危險(xiǎn)場(chǎng)景。
來(lái)源:蓋世汽車(chē)
作者:Fairy
本文地址:http://ewshbmdt.cn/news/jishu/151164
以上內(nèi)容轉(zhuǎn)載自蓋世汽車(chē),目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(ewshbmdt.cn)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。