日前,美國人工智能研究公司OpenAI發(fā)布了首個視頻生成模型“Sora” ,該模型可以根據(jù)文本內(nèi)容生成長約1分鐘的視頻,這也是人工智能領(lǐng)域一項重要的突破。
OpenAI在官網(wǎng)上詳細介紹了Sora的功能和特點,稱其能夠生成包含多個角色、特定類型運動以及精確主題和背景細節(jié)的復雜場景。該模型不僅能夠理解用戶在文本提示中所要求的內(nèi)容,更能將這些事物與現(xiàn)實世界中的存在方式相結(jié)合,呈現(xiàn)出逼真的視頻效果。
此外,Sora還可以根據(jù)靜態(tài)圖片生成動畫,并且對現(xiàn)有視頻進行擴展,延伸畫面的同時保持視覺風格的一致性。
作為展示,OpenAI發(fā)布了由Sora生成的視頻,比如一名女足漫步在東京街頭。在這則片段中,無論是主人公還是她身后的背景人群,動作都非常自然流暢。人物面部的細節(jié)刻畫,也很細膩逼真,基本沒有什么違和、突兀的感覺。
不過,OpenAI也坦承目前Sora也存在一定的弱點,它可能難以準確模擬復雜場景中的物理現(xiàn)象,也可能無法理解具體的因果關(guān)系。例如,一個人可能會咬一口餅干,但咬過之后,餅干上可能就沒有咬痕了。
不管怎樣,Sora的問世震撼了整個科技圈。一時間“Sora會砸掉誰的飯碗?”成為熱議的話題,短視頻和影視行業(yè)自然首當其沖。
一眾大佬也是先后發(fā)聲。馬斯克就發(fā)文寫道“gg humans”,意思是人類認輸了,心服口服。Sora官號則互動道:現(xiàn)在開始由我們來接管。
還有網(wǎng)友將Sora和特斯拉FSD聯(lián)系中一起,稱二者之間有很多關(guān)聯(lián),馬斯克也回應:“特斯拉用精確物理原理生成真實世界視頻大約有一年了。這還不算什么超有趣的事情,因為所有的訓練數(shù)據(jù)都來自汽車,所以它看起來就像特斯拉的視頻,盡管它也是動態(tài)生成的(而不是記憶的)世界。我們的 FSD 訓練計算能力不足,所以還沒有使用其他視頻進行訓練,但當然可以。今年晚些時候,當我們有空余能力時,就會進行訓練?!?/p>
360創(chuàng)始人周鴻祎也發(fā)文《Sora意味著實現(xiàn)通用人工智能可能從10年縮短至1年》。
此外,周鴻祎在直播還談到了中美在AI領(lǐng)域之間的差距。他表示,國內(nèi)的水平離OpenAI至少還有1年以上的差距,并且認為除了GPT5外,OpenAI還有其他的“秘密武器”沒有亮出來,那么中國跟美國AI的差距不僅沒有縮小,反而還在加大。
不過,周鴻祎并不看好Sora在短期可以顛覆短視頻甚至影視行業(yè)。周鴻祎表示,目前Sora具備了產(chǎn)生優(yōu)質(zhì)片段的能力,但不具備講述好一個完整故事的能力。它更可能成為傳統(tǒng)影視業(yè)有力的生產(chǎn)力工具,從而去激發(fā)更多人的創(chuàng)造力,這也給普通人提供了更多可能性。
來源:第一電動網(wǎng)
作者:MANU
本文地址:http://ewshbmdt.cn/news/shichang/219424
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。