国产精品久久久久久久免费看,国产成人麻豆亚洲综合无码精品,国产精品白丝av嫩草影院,国产成人亚洲精品无码h在线 ,大又大又粗又硬又爽少妇毛片

  1. 首頁
  2. 大牛說
  3. 存算一體芯片,會成為AI計算的原子彈嗎?

存算一體芯片,會成為AI計算的原子彈嗎?

國產(chǎn),存算一體,基于 12nm 工藝制程,在 Int8 數(shù)據(jù)精度下實現(xiàn)高達 256TOPS 的物理算力,典型功耗低至 35W,能效比高達 7.3Tops/W,高計算效率、低計算延時、低工藝依賴……

這是5月10日 ,后摩智能正式發(fā)布的首款存算一體智駕芯片鴻途?H30的關(guān)鍵參數(shù),是不是讓你眼前一亮?

圖片

后摩智能創(chuàng)始人兼CEO吳強

這款芯片的關(guān)鍵詞有兩個——“存算一體”和“智駕”。

后者并不陌生,且已有特斯拉FSD、英偉達Orin、地平線征程5等代表產(chǎn)品。因此,想要在這些產(chǎn)品中留下印象,“存算一體”是關(guān)鍵。

1

什么是存算一體?

存算一體這個概念最早可以追溯到上個世紀(jì),沒有很快興起主要有兩個原因:

一是當(dāng)時存算一體雖然可以解決部分性能提升問題,但能解決的部分在整個系統(tǒng)中只占10%-20%,意義不大。更重要的一點是,過去幾十年摩爾定律還在持續(xù)被驗證,行業(yè)并不需要架構(gòu)的創(chuàng)新,只需要每一到兩年升級一代芯片工藝,就能實現(xiàn)性能的快速提升和成本的同步降低。

但隨著摩爾定律逐漸走到盡頭,以及近幾年云計算和人工智能應(yīng)用的快速發(fā)展,數(shù)據(jù)洪流撲面而來,數(shù)據(jù)搬運慢、搬運能耗大等問題成為了計算的關(guān)鍵瓶頸。

圖片

馮諾依曼架構(gòu)示意圖

在經(jīng)典的馮諾依曼架構(gòu)中,數(shù)據(jù)存儲與數(shù)據(jù)處理在物理上是兩個相互分離的單元,在數(shù)據(jù)處理過程中,處理器與存儲器之間需要不斷地通過數(shù)據(jù)總線交換數(shù)據(jù)。

從下圖不難看出,算力發(fā)展速度遠超存儲器,導(dǎo)致存儲器的數(shù)據(jù)訪問速度愈發(fā)跟不上處理器的數(shù)據(jù)處理速度,后者性能與效率受到嚴(yán)重制約,這就是我們常說的“存儲墻”。

圖片

△截圖來自《存算一體芯片技術(shù)及其最新發(fā)展趨勢》

另外,從處理單元外的存儲器提取數(shù)據(jù),搬運時間往往是運算時間的成百上千倍,整個過程的無用能耗大概在60%-90%之間,能效非常低。“功耗墻”,同樣成為了限制芯片發(fā)展的因素。

解決數(shù)據(jù)在計算單元和存儲單元之間頻繁的移動問題,成了深度學(xué)習(xí)加速的最大挑戰(zhàn)。

圖片

過去幾年,行業(yè)嘗試了多種方法,例如為了減少數(shù)據(jù)搬運的大粒度的指令(集)或?qū)S弥噶?/span>(集)、訪存優(yōu)化(替換/預(yù)?。?/span>、調(diào)度優(yōu)化、內(nèi)存/緩存壓縮、低擺幅電路、大緩存技術(shù)等;或是提高并行度的SIMD、SIMT、STMD、指令預(yù)測等技術(shù);還有降低數(shù)據(jù)進度、使用新型封裝、器材或材料等方式,但都未能從根本上解決數(shù)據(jù)密集型算力的問題。

突破兩堵墻,依然是關(guān)鍵,此時,存算一體架構(gòu)開始重入行業(yè)視野。

2

以場景做選擇

存算一體可以簡單從字面理解為在存儲單元中潛入計算能力,以新的運算架構(gòu)進行二維和三維矩陣乘法/加法運算,從本質(zhì)上消除不必要的數(shù)據(jù)搬移的延遲和功耗,大幅提高AI計算效率,降低成本。

從實現(xiàn)路徑上,雖然沒有統(tǒng)一的定義,但根據(jù)計算單元與存儲單元的關(guān)系主要有查存計算、近存計算、存內(nèi)計算和存內(nèi)邏輯,而目前行業(yè)中使用最多的是近存計算和存內(nèi)計算。

前者計算操作由位于存儲區(qū)域外部的獨立計算芯片/模塊完成,通過先進的封裝方式以及合理的硬件布局和結(jié)構(gòu)優(yōu)化,增強二者間通信帶寬,增大數(shù)據(jù)傳輸速率,進而提高數(shù)據(jù)處理效率。這種架構(gòu)設(shè)計的代際設(shè)計成本較低,適合傳統(tǒng)架構(gòu)芯片轉(zhuǎn)入。典型代表是AMD的Zen系列CPU,2021年年末,阿里達摩院推出基于SeDRAM的3D堆疊芯片也是采用了該技術(shù)路徑。

而存內(nèi)計算由位于存儲芯片/區(qū)域內(nèi)部的獨立計算單元完成,存儲和計算可以是模擬也可以是數(shù)字。

國外的Mythic,千芯、閃億、知存以及這次發(fā)布新產(chǎn)品的后摩智能都是這條路徑上的代表企業(yè)。

除了技術(shù)路徑,在存儲器選擇上,存算一體芯片也有兩個主要方向:

一、易失性存儲器,但在計算上具有突出的優(yōu)勢的,主要有SRAM靜態(tài)隨機存儲器和DRAM動態(tài)隨機存儲器;

二、非易失存儲器,在芯片的成本上具有一定優(yōu)勢的,主要有RRAM 阻變隨機存儲器、MRAM 磁性隨機存儲器、FeRAM 鐵電隨機存儲器、PCM 相變存儲器、FLASH 閃存等。

世上沒有完美的選擇,自然沒有一種存儲器具備在所有場景下的絕對優(yōu)勢。因此,芯片企業(yè)存儲器件的選擇,以及數(shù)字存算還是模擬存算的選擇,都與應(yīng)用場景密切相關(guān)。

圖片

△截圖來自《存算一體芯片技術(shù)及其最新發(fā)展趨勢》

對于把重點放在智駕的后摩,SRAM顯然是其最優(yōu)解。

3

以新型架構(gòu)擴展算力

根據(jù)后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮介紹,后摩面向智能駕駛場景打造了專用 IPU(處理器架構(gòu))——天樞架構(gòu),采用多核、多硬件線程的方式擴展算力。

一個芯片里有4個完全相同的IPU核,每個IPU核內(nèi)部,又由4個完全相同的Tile組成,每個Tile對應(yīng)一個或者多個硬件線程,每個Tile的內(nèi)部又包括了CPU、Tensor Engine、Special Function Unit, DMA和Vector Processor等,其中Tensor Engine就是由存算電路和一個Feature Buffer,還有相應(yīng)的一些控制電路組成,這些計算單元在CPU的統(tǒng)一調(diào)度下進行計算。

圖片

“在SRAM電路旁邊,我們加入了一些定制化的電路結(jié)構(gòu),包括乘法器、加法數(shù)、累加器等,這些定制化的電路結(jié)構(gòu)和SRAM的電路整合在一起,就實現(xiàn)高效的存內(nèi)并行計算。存儲器單元中存儲的數(shù)據(jù),可以在同一時刻一起讀出來參與計算?!?陳亮解釋說,“定制化的乘加電路和傳統(tǒng)的SRAM Bit Cell電路完全融合在一起,帶來更加規(guī)整的電路結(jié)構(gòu),因而就有更緊湊的電路設(shè)計,面積也就相應(yīng)減少了。不管是傳統(tǒng)的SRAM電路,還是定制化的計算電路,都是純數(shù)字的設(shè)計,因而不會有任何的計算誤差?!?/span>

現(xiàn)場,陳亮還展示了后摩智能存算一體電路的一些技術(shù)參數(shù)與業(yè)界5nm工藝的對比。后摩這款芯片在采用相對更成熟的12納米制程后,按陳亮的說法,實現(xiàn)了“既要馬兒跑,又讓馬兒少吃草”的結(jié)果。

“我們已經(jīng)在28納米、22納米、16納米、12納米等不同工藝下進行過流片和測試?!?/span>

圖片

△后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮

據(jù)悉,目前鴻途?H30 已成功運行常用的經(jīng)典CV網(wǎng)絡(luò)和多種自動駕駛先進網(wǎng)絡(luò),包括當(dāng)前業(yè)內(nèi)最受關(guān)注的 BEV 網(wǎng)絡(luò)模型以及廣泛應(yīng)用于高階輔助駕駛領(lǐng)域的 Pointpillar 網(wǎng)絡(luò)模型。以鴻途?H30 打造的智能駕駛解決方案已經(jīng)在新石器的無人小車上完成部署,這也是業(yè)界第一次基于存算一體架構(gòu)的芯片成功運行端到端的智能駕駛技術(shù)棧。

4

量產(chǎn),漫長的季節(jié)

本次發(fā)布會,后摩智能同步推出了基于鴻途?H30 芯片打造的智能駕駛硬件平臺——力馭?,CPU 算力高達200 Kdmips,AI算力達256Tops(INT8物理算力),支持多傳感器輸入。官方介紹,力馭?平臺功耗僅為 85W,可采用更加靈活的散熱方式,實現(xiàn)更低成本的便捷部署,有利于推動大算力智能駕駛場景的普及應(yīng)用。

此外,為了讓客戶擁有更好的產(chǎn)品使用體驗,后摩智能還基于鴻途?H30 芯片自主研發(fā)了一款軟件開發(fā)工具鏈——后摩大道?,支持 PyTorch、TensorFlow 、ONNX 等主流開源框架,編程兼容 CUDA 前端語法,同時支持 SIMD 和 SIMT 兩種編程模型,兼顧運行效率和開發(fā)效率,以無侵入式的底層架構(gòu)創(chuàng)新保障了通用性的同時,進一步實現(xiàn)了鴻途?H30 的高效、易用。

據(jù)后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭透露,鴻途?H30 將于6月份開始給 Alpha 客戶送測。同時,后摩智能的第二代產(chǎn)品鴻途?H50 已經(jīng)在全力研發(fā)中,將于2024年推出,支持客戶 2025年的量產(chǎn)車型。

圖片

△后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭

行業(yè)對大算力芯片需求的激增,給了后來者后摩智能迎頭趕上的空間,不到半年時間完成芯片流片、點亮到發(fā)布,后摩對于時代給予的機會展現(xiàn)出了十分積極的姿態(tài)。不過這還僅僅是開始,想要進汽車供應(yīng)鏈,產(chǎn)品送測后還有定點、訂單、小規(guī)模試裝,然后才是規(guī)模量產(chǎn),量產(chǎn)后還要看終端的銷量……過程中的變數(shù)依然很大。

另一個重大課題,就是讓每一家科技公司都頭痛的工程交付。就像發(fā)布會現(xiàn)場一位下游需求方說的,“存算一體是個新的方向和嘗試,但關(guān)鍵要看量產(chǎn)落地的能力?!?/span>

對于后摩,依然有一個“漫長的季節(jié)”,度過之后,將是另一片天地。

來源:第一電動網(wǎng)

作者:智車星球

本文地址:http://ewshbmdt.cn/kol/202412

返回第一電動網(wǎng)首頁 >

收藏
23
  • 分享到:
發(fā)表評論
新聞推薦
大牛作者

智車星球

服務(wù)智能汽車創(chuàng)業(yè)者,提供媒體報道、品牌公關(guān)、會議活動、投融資對接等其他定制服務(wù)。

  • 178
    文章
  • 7753
    獲贊
閱讀更多文章
熱文榜
日排行
周排行
第一電動網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進行報價!

第一電動網(wǎng)
Hello world!
-->