過(guò)去一周,堪稱(chēng)是黃仁勛職業(yè)生涯的高光時(shí)刻。
其所創(chuàng)辦的英偉達(dá)市值一度突破1萬(wàn)億美元,成為全球最受矚目的AI芯片巨頭。與此同時(shí),新型“算力殺器”DGX GH200超級(jí)計(jì)算機(jī)的發(fā)布,無(wú)疑將引燃生成式AI的下一個(gè)增長(zhǎng)點(diǎn)。
此刻沒(méi)有人會(huì)質(zhì)疑,英偉達(dá)在人工智能領(lǐng)域所處的領(lǐng)導(dǎo)地位。就像媒體大篇幅渲染的那樣,黃仁勛現(xiàn)在是“秦始皇吃花椒”——贏麻了。
價(jià)格遭“哄抬”的GPU
圖片來(lái)源:英偉達(dá)
“全世界都在講中國(guó)話(huà)”這句歌詞,放到英偉達(dá)身上,應(yīng)當(dāng)變成“全世界都在搶GPU”。
截至今年4月30日的3個(gè)月里,英偉達(dá)共實(shí)現(xiàn)營(yíng)收71.9億美元,數(shù)據(jù)中心業(yè)務(wù)貢獻(xiàn)了42.8億美元。隨著生成式AI大模型不斷涌現(xiàn),云計(jì)算和科技公司對(duì)GPU的需求都達(dá)到了前所未有的高度。
目前這種情況還在繼續(xù)。來(lái)自供應(yīng)鏈的消息顯示,英偉達(dá)在手訂單已經(jīng)超過(guò)10萬(wàn)片。包括A100/A800和H100等GPU產(chǎn)品不僅供不應(yīng)求,采購(gòu)價(jià)格也是水漲船高。
不到半年的時(shí)間,A100價(jià)格上漲近四成。若按照1萬(wàn)美元、1000片的起步價(jià)來(lái)計(jì)算,多出的成本少則也能達(dá)到數(shù)百萬(wàn)美元。而早在今年2月份,國(guó)內(nèi)某大模型供應(yīng)商就透露,A100的租賃價(jià)格已上漲了約50%。
盡管如此,此類(lèi)GPU如今已是緊俏貨。根據(jù)媒體消息,眼下,英偉達(dá)選擇優(yōu)先供貨Google、微軟等至少下單了1萬(wàn)~2萬(wàn)片的云端大客戶(hù),其他客戶(hù)的交付周期已延長(zhǎng)至6個(gè)月。相關(guān)服務(wù)器廠商預(yù)計(jì),GPU短缺情況至少會(huì)持續(xù)到明年。
GPU加單不斷,陷入全球瘋搶?zhuān)澈笫且粓?chǎng)關(guān)于算力的爭(zhēng)奪戰(zhàn)。
AI對(duì)計(jì)算能力的需求呈指數(shù)級(jí)增長(zhǎng);圖源:TheEconomist
《智能世界2030》報(bào)告中預(yù)測(cè),到2030年,人類(lèi)將進(jìn)入YB數(shù)據(jù)時(shí)代,通用算力將增長(zhǎng)10倍、人工智能算力將增長(zhǎng)500倍。
要知道,AI訓(xùn)練與推理離不開(kāi)底層計(jì)算處理器的支持,算力瓶頸已成為人工智能發(fā)展的最大障礙。而生成式AI大模型又是“大算力+強(qiáng)算法”的產(chǎn)物,對(duì)算力的依賴(lài)更加突出。
ChatGPT 的締造者OpenAI就預(yù)計(jì),模型計(jì)算量的增長(zhǎng)速度遠(yuǎn)超人工智能硬件算力的增長(zhǎng)速度,甚至存在萬(wàn)倍差距。摩爾定律放緩,勢(shì)必進(jìn)一步限制人工智能的發(fā)展?jié)摿Α?/p>
因而大模型的出現(xiàn)必然將伴隨著計(jì)算技術(shù)的發(fā)展。
借用黃仁勛在GTC 2023上說(shuō)的話(huà),“如果計(jì)算技術(shù)是以光速在進(jìn)步,那么加速計(jì)算就是超光速的曲速引擎。”而人工智能應(yīng)用負(fù)載對(duì)算力的強(qiáng)烈需求就是能量來(lái)源。近年來(lái),越來(lái)越多的觀點(diǎn)和實(shí)踐都證明了GPU在通用加速計(jì)算領(lǐng)域的優(yōu)勢(shì)。
在GPU架構(gòu)里,計(jì)算單元(ALU)占據(jù)了相當(dāng)大的比重。相比CPU,GPU的浮點(diǎn)運(yùn)算能力更強(qiáng),且架構(gòu)專(zhuān)為并行計(jì)算而設(shè)計(jì),可兼容訓(xùn)練和推理,更加注重整體數(shù)據(jù)的吞吐量。同時(shí)隨著可編程性不斷提高,GPU在削減架構(gòu)本身的圖形顯示部分后,可以全部投入到通用計(jì)算里。
也就是所謂的“GPGPU”,通用計(jì)算處理器。
圖片來(lái)源:HEAVY.AI
結(jié)合IDC的報(bào)告,通用GPU已成為數(shù)據(jù)中心底層硬件的首選,份額高達(dá)61.4%。同時(shí)汽車(chē)行業(yè)訓(xùn)練自動(dòng)駕駛算法的硬件基礎(chǔ)設(shè)施也基本以GPU為主。包括特斯拉、蔚來(lái)、小鵬等都選擇了英偉達(dá)的GPU產(chǎn)品。
根本原因在于,自動(dòng)駕駛算法的發(fā)展需要借助深度神經(jīng)網(wǎng)絡(luò)在高速狀態(tài)下分析海量數(shù)據(jù),而這恰恰可以利用GPU在處理瑣碎信息時(shí)的優(yōu)勢(shì)。
作為并行計(jì)算的開(kāi)拓者,英偉達(dá) GPU在AI服務(wù)器市場(chǎng)的占有率約為60%~70%,遠(yuǎn)超老對(duì)手AMD和英特爾。財(cái)通證券預(yù)測(cè),大語(yǔ)言模型有望持續(xù)拉動(dòng)GPU需求量,2023/2024/2025年大模型有望貢獻(xiàn)GPU市場(chǎng)增量69.88/166.2/209.95億美元。
英偉達(dá)是人工智能時(shí)代的最大贏家嗎?雖然不能就此斷論,但在大趨勢(shì)面前,它的確是被時(shí)代塑造的“巨無(wú)霸”。
人工智能計(jì)算中心硬件基礎(chǔ)設(shè)施
云端/邊緣通用GPU,誰(shuí)執(zhí)牛耳?
不過(guò),黃仁勛也有自己的擔(dān)憂(yōu)。
近期,他在接受《金融時(shí)報(bào)》《日本經(jīng)濟(jì)新聞》等多家主流媒體采訪時(shí)一直強(qiáng)調(diào),美國(guó)對(duì)華芯片出口管制措施將造成嚴(yán)重影響。
英偉達(dá)約有21%的收入來(lái)自中國(guó)大陸,相比博通、高通等美國(guó)公司,這個(gè)數(shù)字不算起眼,但黃仁勛直言,這項(xiàng)禁令讓英偉達(dá)“雙手被反綁”。中國(guó)大陸約占美國(guó)科技業(yè)市場(chǎng)的三分之一,如果雙邊無(wú)法正常貿(mào)易,美國(guó)公司無(wú)疑首當(dāng)其沖。
更重要的是,這些公司既要砍產(chǎn)能,又可能面臨芯片供過(guò)于求、業(yè)績(jī)衰減、競(jìng)爭(zhēng)力下滑的風(fēng)險(xiǎn)。
去年8月,美國(guó)政府發(fā)布了一項(xiàng)新禁令,要求英偉達(dá)不得對(duì)中國(guó)大陸(含香港)出口已經(jīng)商用的A100和即將推出的H100系列產(chǎn)品,引發(fā)市場(chǎng)嘩然。
不過(guò)隨后,華盛頓給予了英偉達(dá)A100半年的緩沖期,在2023年3月1日前,開(kāi)放英偉達(dá)出口美國(guó)客戶(hù)的A100芯片訂單到中國(guó)大陸。同時(shí),批準(zhǔn)其在2023年9月1日前,通過(guò)香港子公司供應(yīng)GPU芯片。
這之后,就有了國(guó)內(nèi)云服務(wù)提供商、科技公司和自動(dòng)駕駛公司紛紛囤積GPU的故事。
盡管英偉達(dá)后續(xù)推出了符合出口標(biāo)準(zhǔn)的“特供版”GPU——A800和H800,但地緣政治風(fēng)險(xiǎn)就像懸在頭頂?shù)倪_(dá)摩克利斯之劍,不知道什么時(shí)候就會(huì)落下。
黃仁勛在Computex圓桌會(huì)議上也表示,無(wú)論(美國(guó))新規(guī)是什么,英偉達(dá)都會(huì)絕對(duì)遵守。但他也稱(chēng),中國(guó)大陸會(huì)利用這個(gè)機(jī)會(huì)培育本土產(chǎn)業(yè)。
他舉了一個(gè)例子,“如果你本身不在芯片行業(yè),但想創(chuàng)辦一家公司,你會(huì)成立什么公司?——你會(huì)成立一家GPU企業(yè)?!焙翢o(wú)疑問(wèn),AI催生的大量需求和高端GPU的限售,給了國(guó)產(chǎn)GPU巨大的替代空間。
GPU的發(fā)展路徑主要有兩條,傳統(tǒng)的圖形渲染和聚焦高性能計(jì)算的通用GPU。應(yīng)用則面向云端和邊緣兩大領(lǐng)域。近年來(lái),國(guó)內(nèi)涌現(xiàn)出了大批GPU公司,都拿出了較為成熟的產(chǎn)品和技術(shù)。在通用GPU領(lǐng)域,不乏有正面挑戰(zhàn)英偉達(dá)在云端數(shù)據(jù)中心地位的。
“我們必須跑得非常快,中國(guó)目前投入到芯片領(lǐng)域的資源十分龐大,我們不能低估他們(這些公司)?!边@是黃仁勛的最新發(fā)言。
在此,蓋世汽車(chē)也整理了國(guó)內(nèi)幾家做通用GPU的公司,名單及相關(guān)產(chǎn)品如下:
1.寒武紀(jì):
2022年3月21日發(fā)布新款訓(xùn)練加速卡MLU370-X8,搭載雙芯片四芯粒思元370,集成寒武紀(jì)MLU-Link多芯互聯(lián)技術(shù),主要面向訓(xùn)練任務(wù),在業(yè)界應(yīng)用廣泛的YOLOv3、Transformer等訓(xùn)練任務(wù)中, 8卡計(jì)算系統(tǒng)的并行性能平均達(dá)到350W RTX GPU的155%。
2.壁仞科技:
2022年8月9日發(fā)布首款通用GPU芯片BR100,采用7nm工藝,集成770億晶體管,使用Chiplet技術(shù),2.5D CoWos封裝技術(shù),芯片面積達(dá)到1000平方毫米。算力創(chuàng)下全球紀(jì)錄,16位浮點(diǎn)算力達(dá)到1000T以上、8位定點(diǎn)算力達(dá)到2000T以上,單芯片峰值算力達(dá)到PFLOPS級(jí)別。
該公司現(xiàn)已加入中國(guó)移動(dòng)算力網(wǎng)絡(luò)“芯合”新型智算開(kāi)放實(shí)驗(yàn)室,并成為中國(guó)電信“云網(wǎng)基礎(chǔ)設(shè)施安全國(guó)家工程研究中心云計(jì)算合作伙伴”。
3.燧原科技:
2021年7月7日,燧原科技推出第二代人工智能訓(xùn)練產(chǎn)品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓(xùn)練加速卡和“云燧T21”訓(xùn)練OAM模組。并先后與上海國(guó)際汽車(chē)城、云豹智能、達(dá)觀數(shù)據(jù)等建立合作關(guān)系,打造計(jì)算平臺(tái)。
4.天數(shù)智芯:
2022年12月21日,天數(shù)智芯正式推出了通用GPU推理產(chǎn)品“智鎧100”。該芯片支持FP32、FP16、INT8等多精度混合計(jì)算,實(shí)現(xiàn)了指令集增強(qiáng)、算力密度提升、計(jì)算存儲(chǔ)再平衡,支持多種視頻規(guī)格解碼。而智鎧100產(chǎn)品卡,可以提供最高384TOPS@int8、96TFlops@FP16、24TFlops@FP32的峰值算力,800GB/s的理論峰值帶寬以及128路并發(fā)的多種視頻規(guī)格解碼能力。截至目前,該公司已與云創(chuàng)大數(shù)據(jù)等公司就AI大模型達(dá)成合作。
5.摩爾線程:
2022年11月3日,摩爾線程推出了基于自研架構(gòu)MUSA的第二顆多功能GPU芯片“春曉”,以及基于春曉打造的面向服務(wù)器的GPU產(chǎn)品MTT S3000。
MTT S3000支持DirectX、OpenGL、OpenGL ES、Vulkan、OpenCL等主流圖形和計(jì)算接口,兼容CUDA,可為AI推理和訓(xùn)練、云游戲、云渲染、視頻云、數(shù)字孿生、數(shù)字內(nèi)容創(chuàng)作等場(chǎng)景提供通用智能算力支持,旨在為數(shù)據(jù)中心、智算中心和元計(jì)算中心的建設(shè)構(gòu)建堅(jiān)實(shí)算力基礎(chǔ),助力元宇宙多元應(yīng)用創(chuàng)新和落地。
除了以上公司,國(guó)內(nèi)還有景嘉微、沐曦等知名GPU企業(yè),以及一批借著人工智能革命飛快成長(zhǎng)的GPU初創(chuàng)。在產(chǎn)品應(yīng)用和平臺(tái)生態(tài)建設(shè)方面,國(guó)內(nèi)GPU企業(yè)不比英偉達(dá)等海外巨頭,但就像黃仁勛自己說(shuō)的,第一波AI應(yīng)用熱潮在云端大語(yǔ)言模型上,而下一波則在企業(yè)端。電競(jìng)游戲、元宇宙、自動(dòng)駕駛都可能是未來(lái)通用GPU的風(fēng)口。
英偉達(dá)贏在了上半場(chǎng),但下半場(chǎng),誰(shuí)又能殺出重圍,尚未可知。 即便遍地是黃金,即便強(qiáng)如英偉達(dá),也絕對(duì)不能松懈。
來(lái)源:蓋世汽車(chē)
作者:徐珊珊
本文地址:http://ewshbmdt.cn/news/shichang/204222
以上內(nèi)容轉(zhuǎn)載自蓋世汽車(chē),目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(ewshbmdt.cn)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。