新聞資訊
創(chuàng)投旗艦店 | 打破存儲墻——存算一體技術(shù)的突破與未來
發(fā)布時間:
2025-04-02
來源:
如果您對文章有更深入的見解與想法,可以聯(lián)系本文作者:南京市創(chuàng)新投資集團投資五部 許希文 xuxw@njicg.com
引言
近年來,人工智能技術(shù)的廣泛應(yīng)用深刻改變了我們的生活,從抖音等平臺精準推薦短視頻內(nèi)容,到自動駕駛系統(tǒng)智能識別復(fù)雜場景,從優(yōu)化物流配送路徑的算法,到實時翻譯多國語言的智能助手,這些便利的實現(xiàn)背后都依賴于強大的算力支持。然而,在算力需求持續(xù)攀升的背后,一個隱藏的瓶頸正逐漸顯現(xiàn)——“存儲”與“計算”之間的分離問題。
自馮·諾依曼架構(gòu)奠定現(xiàn)代計算機基礎(chǔ)以來,計算單元與存儲單元的分離設(shè)計成為主流。二者之間通過數(shù)據(jù)總線進行交互,類似于兩位分工明確的工人:一位負責處理數(shù)據(jù),另一位負責存儲數(shù)據(jù)。然而,隨著數(shù)據(jù)規(guī)模的指數(shù)級增長,這種架構(gòu)的局限性愈發(fā)突出。數(shù)據(jù)在存儲單元與計算單元之間頻繁搬運,不僅耗費大量時間,還導致能耗急劇增加。據(jù)統(tǒng)計,在高算力場景中,數(shù)據(jù)搬運的能耗占比已超過80%,成為制約算力進一步提升的關(guān)鍵瓶頸——即所謂的“存儲墻”。
在人工智能時代,算力被視為推動科技發(fā)展的核心引擎,而“存儲墻”無異于壓制引擎性能的一塊巨大障礙。如何突破這一限制,充分釋放算力潛力?“存算一體技術(shù)”應(yīng)運而生,為解決這一問題提供了全新的路徑。
一、馮·諾依曼架構(gòu)與存儲墻
1.1 馮·諾依曼架構(gòu)的輝煌與局限
馮·諾依曼架構(gòu)是現(xiàn)代計算機設(shè)計的基礎(chǔ),由約翰·馮·諾依曼在1945年提出。這種架構(gòu)的特點是,程序和數(shù)據(jù)存儲在同一個存儲器里,并通過一條通道(總線)傳輸給處理器執(zhí)行。如圖1所示,處理器包括兩個主要部分:計算單元(負責運算)和控制單元(負責讀取指令并指揮操作)。雖然這種設(shè)計簡單清晰,但也有明顯的缺點,即 “馮·諾依曼瓶頸”:指令和數(shù)據(jù)必須通過同一條通道排隊傳輸,導致速度變慢;同時,處理器的運算速度遠快于存儲器的數(shù)據(jù)傳輸速度,常常需要等待數(shù)據(jù),影響效率。盡管如此,這一架構(gòu)仍是現(xiàn)代計算機的基礎(chǔ),通過加入緩存和流水線技術(shù),極大提升了運算速度,為計算機的發(fā)展鋪平了道路。
圖1 馮·諾依曼架構(gòu)示意圖
然而在如今的人工智能時代,算力需求以指數(shù)級增長,這一傳統(tǒng)架構(gòu)的局限性也逐漸顯現(xiàn):數(shù)據(jù)需要在存儲與計算單元間頻繁傳輸,大量的時間和能量被浪費在了數(shù)據(jù)“搬運”上。這堵無形的“存儲墻”,正成為限制算力發(fā)展的關(guān)鍵瓶頸!
存儲墻瓶頸在高算力任務(wù)中表現(xiàn)尤為明顯?,F(xiàn)代AI計算對存儲帶寬的需求已高達1PB/s,而主流存儲器的速度卻遠低于這一標準,例如SRAM的傳輸速度僅為10-100TB/s,DRAM更低,僅為40GB-1TB/s,二者之間的差距達到數(shù)十甚至上百倍。這種速度差使得計算單元難以充分利用性能,系統(tǒng)的整體效率被大幅拖累。此外,數(shù)據(jù)搬運的高能耗也是存儲墻的重要表現(xiàn),在自然語言處理類任務(wù)中,數(shù)據(jù)搬運占據(jù)了總能耗的82%。這種瓶頸限制了AI、大數(shù)據(jù)等領(lǐng)域算力的進一步提升,并導致高昂的成本與能耗,成為現(xiàn)代計算架構(gòu)必須解決的核心問題。
圖2 計算與存儲的能耗對比圖
1.2 打破存儲瓶頸:存算一體的崛起
阿姆達爾定律:指明優(yōu)化方向
阿姆達爾定律由計算機科學家吉恩·阿姆達爾提出,用于衡量系統(tǒng)性能提升的極限。它指出:一個計算系統(tǒng)的整體加速比,取決于任務(wù)中串行部分的比例。如圖3所示,S代表加速比,即使用 n個處理器后性能提升的倍數(shù);P為程序中可并行化的部分比例;(1-P)即為程序中必須串行完成的部分比例;n為并行使用的處理器數(shù)量。理論上,當 P 越大時,可并行化的任務(wù)越多,加速效果就越好。但當處理器的數(shù)量(n)無限增加時,系統(tǒng)加速比將會無限趨近于1/(1-P),也就意味著即使并行部分得到極大的優(yōu)化,串行部分的存在依然會限制整體性能的提升。
圖3 阿姆達爾定律
在馮·諾依曼架構(gòu)下,數(shù)據(jù)的搬運屬于典型的串行任務(wù),其傳輸速度遠低于計算速度,導致處理器等待時間過長,成為系統(tǒng)性能的核心瓶頸。因此,根據(jù)阿姆達爾定律,優(yōu)化系統(tǒng)性能的關(guān)鍵在于減少甚至消除串行部分的數(shù)據(jù)搬運,即打破“存儲墻”。這為現(xiàn)代計算架構(gòu)的優(yōu)化指明了方向:存儲與計算的深度融合。
存算一體技術(shù):解決存儲墻的關(guān)鍵路徑
為了應(yīng)對存儲瓶頸問題,存算一體技術(shù)應(yīng)運而生。存算一體的核心思路是通過存儲與計算的物理融合,顯著減少數(shù)據(jù)搬運需求。目前提出了三種主要解決方案:
①近存計算(PNM,Processing Near Memory):通過將計算單元放置在存儲單元附近,縮短物理距離,減少數(shù)據(jù)傳輸?shù)臅r間和能耗。PNM相較于傳統(tǒng)架構(gòu)提高了效率,但數(shù)據(jù)搬運仍然存在,未能完全解決問題。
圖4 近存計算示意圖
?、诖鎯?nèi)處理(PIM,Processing In Memory):如圖5所示,將簡單的計算功能嵌入存儲器內(nèi)部,例如嵌入加法器或乘法器,用于執(zhí)行特定的任務(wù)(如矩陣運算)。PIM在減少數(shù)據(jù)搬運方面更進一步,但其計算能力有限,僅適用于特定場景。
圖5 存內(nèi)處理示意圖
?、鄞鎯?nèi)計算(CIM,Computation In Memory):存內(nèi)計算是存算一體的最終形式,如圖6所示,通過將復(fù)雜計算能力直接集成到存儲單元中,真正實現(xiàn)了計算與存儲的深度融合。CIM不僅徹底消除了數(shù)據(jù)搬運,還顯著提升了計算密度和能效,適合AI推理、邊緣計算等場景,是未來高算力需求的理想解決方案。
圖6 存內(nèi)計算示意圖
二、AI算力需求開啟千億級市場
2.1 存算一體技術(shù)發(fā)展歷程
存算一體技術(shù)的發(fā)展歷程可以追溯到20世紀60年代。1969年,斯坦福研究所的研究人員首次提出了存算一體的概念,認為通過將計算單元和存儲單元深度融合,能夠顯著減少數(shù)據(jù)搬運帶來的延遲和能耗。然而,由于當時的硬件技術(shù)限制,這一概念僅停留在理論層面,尚無法投入實際應(yīng)用。在1980年代至2000年代,存算技術(shù)進入初步實踐階段,學術(shù)界嘗試在DRAM等存儲器中集成簡單的計算能力(如加法和邏輯運算),開創(chuàng)了近存計算(PNM)和存內(nèi)處理(PIM)的研究方向,但因存儲器本身性能有限、制造成本高,進展較為緩慢。
真正推動存算技術(shù)進入突破階段的是21世紀初新型存儲器技術(shù)的崛起。2008年,憶阻器(ReRAM)的發(fā)明成為存算技術(shù)的重要轉(zhuǎn)折點,這種存儲器不僅可以存儲數(shù)據(jù),還能直接執(zhí)行布爾邏輯運算。2010年,惠普實驗室成功利用憶阻器完成了簡單運算的硬件實驗,驗證了存算一體架構(gòu)的可行性。此后,磁阻存儲器(MRAM)和相變存儲器(PCM)等新型存儲技術(shù)陸續(xù)被引入存算一體的研究中,存算一體技術(shù)逐漸從理論走向?qū)嵺`。進入2010年代,產(chǎn)業(yè)界開始嘗試將存算技術(shù)應(yīng)用于實際產(chǎn)品,例如Mythic推出的基于NOR Flash的AI芯片M1108成為早期商用案例。2020年后,存算技術(shù)進入商業(yè)化加速階段,特別是在AI、大數(shù)據(jù)和邊緣計算場景中,基于存算一體架構(gòu)的芯片憑借其高能效和低成本的優(yōu)勢,逐漸成為市場主流。例如,國內(nèi)的知存科技、昕原半導體等企業(yè)陸續(xù)推出面向端側(cè)和邊緣計算的存算芯片,推動技術(shù)在實際場景中的廣泛應(yīng)用。
存算一體技術(shù)的發(fā)展歷程體現(xiàn)了技術(shù)從理論構(gòu)想到產(chǎn)業(yè)化落地的跨越式進步。如今,隨著AI模型規(guī)模和算力需求的持續(xù)增長,存算一體技術(shù)正以其獨特的架構(gòu)優(yōu)勢,為突破存儲墻瓶頸和支撐未來算力需求提供重要解決方案。
圖7 存算一體技術(shù)的發(fā)展歷程
2.2 存算一體技術(shù)的優(yōu)勢
存算一體技術(shù)以其高性價比和超低功耗的優(yōu)勢,正逐漸成為AI硬件領(lǐng)域不可忽視的“殺手級”解決方案。如圖8,以Z公司的芯片為例,僅需0.8美元就能實現(xiàn)50 GOPS的算力,而傳統(tǒng)CPU和GPU實現(xiàn)同等算力的成本卻分別高達20美元和30美元。更令人驚喜的是,存算一體技術(shù)通過將計算單元直接集成到存儲單元中,極大地減少了數(shù)據(jù)搬運,不僅運行功耗低至5uA-3mA,還讓硬件設(shè)計更加簡潔高效。這使其在智能耳機、智能音箱等端側(cè)設(shè)備中表現(xiàn)尤為出色,既能提升設(shè)備AI處理能力,又顯著降低成本。此外,存算一體技術(shù)還在快速向邊緣視頻處理和云端AI推理等領(lǐng)域擴展,憑借高效的計算架構(gòu)為高算力場景提供了更綠色、更高效的解決方案,展現(xiàn)出廣闊的市場前景。
圖8 存算一體技術(shù)的優(yōu)勢
2.3 存算一體技術(shù)的應(yīng)用場景
從端到云:滿足不同層級的算力需求
存算一體技術(shù)憑借其高能效和靈活性,正在端、邊、云不同層級的計算場景中大展身手。如圖9所示,在端側(cè),智能耳機、語音助手等設(shè)備通過搭載存算一體芯片,能以極低功耗實現(xiàn)復(fù)雜的語音處理和降噪功能,比如一顆2MB的存算芯片可提供100 Gops的算力,同時顯著降低設(shè)備成本。在邊緣側(cè),智能汽車和AR眼鏡等需要實時數(shù)據(jù)處理的場景,則更看重存算一體的高性能和高能效,比如一顆128MB的芯片可以實現(xiàn)64 Tops的算力,滿足自動駕駛中的實時感知需求。而在云端,存算一體作為下一代AI芯片的關(guān)鍵技術(shù),憑借其超高算力(如2GB芯片實現(xiàn)1024 Tops),在數(shù)據(jù)中心的模型訓練和推理任務(wù)中展現(xiàn)出了綠色高效的潛力。
圖9 存算一體技術(shù)的應(yīng)用場景
存算一體技術(shù)不僅在架構(gòu)設(shè)計上突破傳統(tǒng),還為“類腦計算”這一未來方向奠定了基礎(chǔ)。與傳統(tǒng)的計算架構(gòu)不同,存算一體技術(shù)的矩陣計算模型模擬了大腦神經(jīng)元和突觸之間的連接關(guān)系,這讓它在神經(jīng)網(wǎng)絡(luò)運算中表現(xiàn)出驚人的效率。比如在深度學習任務(wù)中,存算一體技術(shù)的并行計算能力可以快速處理多層感知和推理任務(wù),這種類似人腦的處理方式讓它在智能設(shè)備中實現(xiàn)了更復(fù)雜的場景,比如語音識別、圖像處理以及實時環(huán)境分析。未來,類腦計算與存算一體技術(shù)的結(jié)合,將賦能更多智能設(shè)備,推動從硬件到架構(gòu)的全新進化,讓AI更貼近“智慧”的本質(zhì)。
圖10 類腦計算示意圖
2.4 存算一體技術(shù)市場規(guī)模:千億級賽道加速崛起
存算一體技術(shù)正隨著AI、大數(shù)據(jù)等高算力需求的快速增長,成為推動半導體市場擴張的重要動力。根據(jù)數(shù)據(jù)顯示,到2025年,存算一體小算力芯片市場規(guī)模將達到125億元人民幣,遠期市場空間更為廣闊;到2030年,小算力芯片市場規(guī)模預(yù)計突破1069億元人民幣,而大算力芯片的市場規(guī)模也將達到67億元人民幣,兩者合計將推動存算一體芯片市場整體規(guī)模達到1136億元人民幣。從端、邊、云三層來看,端側(cè)市場的爆發(fā)最為顯著,其規(guī)模從2025年的110億元快速增長到2030年的995億元,成為最大的增量來源。
圖11 2025-2030 存算一體芯片市場規(guī)模預(yù)測
作為存算一體技術(shù)的核心基礎(chǔ),存儲器市場同樣在蓬勃發(fā)展。從2019年到2025年,全球存儲器市場預(yù)計將從1050億美元增長到接近2000億美元,其中DRAM和NAND存儲器雙線增長。尤其是NAND存儲器,在智能終端和數(shù)據(jù)中心需求的驅(qū)動下,將迎來更高的市場占比。存儲器技術(shù)的成熟不僅為存算一體技術(shù)提供了可靠的硬件基礎(chǔ),還推動了存算一體芯片在低功耗、高效率計算場景中的快速落地。
圖12 2019-2025年存儲器市場
三、存內(nèi)計算:打破存儲墻的技術(shù)躍遷之路
從智能終端到邊緣計算,再到云端AI推理,這一技術(shù)正在為不同層級的算力需求提供高效解決方案。而它的核心優(yōu)勢,正是來源于對傳統(tǒng)計算架構(gòu)的顛覆性創(chuàng)新——直接在存儲器中實現(xiàn)計算功能。
與傳統(tǒng)的“近存計算”不同,存內(nèi)計算更進一步,真正實現(xiàn)了存儲與計算的深度融合。它不僅在市場規(guī)模上展現(xiàn)出千億級的增長潛力,更在技術(shù)層面提供了多樣化的實現(xiàn)路徑。接下來,文章將從模擬存內(nèi)計算與數(shù)字存內(nèi)計算兩大技術(shù)路線,以及在不同存儲器中的具體實現(xiàn),來全面探討這一技術(shù)如何打破存儲墻,為未來算力升級奠定基礎(chǔ)。
3.1 存內(nèi)計算的兩大技術(shù)路線
模擬存內(nèi)計算:利用物理規(guī)律實現(xiàn)高效計算
模擬存內(nèi)計算通過直接利用物理規(guī)律(歐姆定律和基爾霍夫定律)在存儲陣列中完成運算,具有高能效和并行計算能力。以圖13中的RRAM(阻變存儲器)存內(nèi)計算矩陣為例,每個存儲單元的導電性(Gij)表示權(quán)重參數(shù),輸入向量 [v1,v2,v3]轉(zhuǎn)化為電壓信號施加到橫向電壓線(Word Line)上,產(chǎn)生與導電性和輸入電壓成正比的電流。通過列方向(Bit Line)的電流累加,實現(xiàn)矩陣-向量乘法,例如 I1=∑jG1jVj ,即完成了數(shù)據(jù)的加權(quán)和。這種直接利用電流、電壓關(guān)系進行計算的方法,無需數(shù)據(jù)搬運,能效極高,尤其適合大規(guī)模矩陣運算。
圖13 基于RRAM的模擬存內(nèi)計算陣列
然而,模擬存內(nèi)計算也面臨一些限制,例如計算精度受信號非線性和噪聲的影響,較難應(yīng)用于高精度場景。盡管如此,其低功耗和高并行特性使其在物聯(lián)網(wǎng)傳感器、可穿戴設(shè)備等對功耗敏感的場景中大放異彩,為終端AI應(yīng)用提供了一種高效的解決方案。
數(shù)字存內(nèi)計算:高精度計算的實現(xiàn)路徑
數(shù)字存內(nèi)計算通過在存儲陣列內(nèi)部集成邏輯運算單元(如與門、加法器等),將計算功能嵌入存儲單元,從而實現(xiàn)存儲與計算的深度融合。圖14展示了基于SRAM的數(shù)字存內(nèi)計算架構(gòu),其核心是“數(shù)字加法樹”(Digital Add Tree)。在這一架構(gòu)中,輸入向量 [IN1,IN2,…,INn]被加載到讀取字線(Read Word Line, RWL)上,與存儲的權(quán)重參數(shù) [W1,W2,…,Wn]逐位相乘。每個存儲單元通過簡單的乘法器完成加權(quán)操作,然后將結(jié)果輸入數(shù)字加法樹,層層累加,最終輸出向量點積結(jié)果。
圖14 基于SRAM的數(shù)字存內(nèi)計算加法樹
相比模擬存內(nèi)計算,數(shù)字存內(nèi)計算具有更高的計算精度,能夠避免模擬信號帶來的非線性誤差和噪聲干擾。然而,其硬件實現(xiàn)相對復(fù)雜,邏輯電路的加入增加了存儲單元的面積和功耗,這使其更適合對精度要求較高且功耗不敏感的場景,例如云端AI推理和科學計算。
數(shù)字存內(nèi)計算通過邏輯電路和數(shù)字信號的精確運算,為實現(xiàn)高精度矩陣運算提供了一種可靠的硬件方案。這種技術(shù)在推動存算一體化發(fā)展、突破存儲墻瓶頸方面具有重要意義,為未來云計算和高性能計算奠定了技術(shù)基礎(chǔ)。
3.2 不同存儲技術(shù)中存內(nèi)計算的實現(xiàn)
在了解了模擬存內(nèi)計算與數(shù)字存內(nèi)計算這兩大技術(shù)路線后,我們不禁好奇,它們是如何在具體存儲器中得以實現(xiàn)的?不同存儲技術(shù)的物理特性決定了其在存內(nèi)計算中的具體應(yīng)用方式和優(yōu)勢。
經(jīng)典存儲器的存算實現(xiàn)
在存算一體技術(shù)的發(fā)展中,NAND Flash 作為經(jīng)典存儲器的重要代表,通過其獨特的存儲單元結(jié)構(gòu)和工作原理,實現(xiàn)了存儲與計算的深度融合。如圖15所示,NAND Flash 的存儲單元由浮柵結(jié)構(gòu)組成,其關(guān)鍵組件包括控制柵、浮柵、絕緣介質(zhì)層和隧穿氧化層。通過調(diào)整電壓,使電子在浮柵和襯底之間的隧穿效應(yīng)發(fā)生變化,從而改變存儲單元的閾值電壓。這種特性不僅用于存儲“0”和“1”狀態(tài),還可以擴展為多級存儲,用于存儲更高密度的數(shù)據(jù)。
圖15 NAND Flash結(jié)構(gòu)示意圖
在存算一體化中,NAND Flash 利用浮柵的多閾值特性,通過精確控制電壓對數(shù)據(jù)進行簡單計算。例如,在讀取數(shù)據(jù)時,存儲單元的電流變化能夠被感知,從而完成加權(quán)累加等操作。這種基于物理特性的計算方法,不僅減少了數(shù)據(jù)搬運的能耗,還提升了大規(guī)模并行計算的效率。
然而,NAND Flash 在存算實現(xiàn)中也面臨可靠性和壽命的挑戰(zhàn),例如隧穿氧化層的薄化可能導致電子泄漏和數(shù)據(jù)穩(wěn)定性下降。通過3D NAND 技術(shù)的堆疊和優(yōu)化,其存儲密度與性能得到了進一步提升,為智能終端和邊緣計算等領(lǐng)域提供了高效的解決方案。NAND Flash 的結(jié)構(gòu)與工作原理,是經(jīng)典存儲器存算實現(xiàn)的典型代表,也是未來存算一體技術(shù)的重要基石。
新型存儲器的存算實現(xiàn)
1、阻變存儲器(ReRAM)
阻變存儲器(ReRAM)是一種基于電阻變化的非易失性存儲技術(shù),通過改變量子薄膜材料的電阻狀態(tài)來實現(xiàn)數(shù)據(jù)存儲。如圖16所示,其基本結(jié)構(gòu)采用金屬-絕緣層-金屬(MIM)的三明治式設(shè)計,由上電極、阻變層和下電極組成。其中,阻變層是關(guān)鍵部分,通過施加電壓形成或斷開導電通道(導電細絲),切換高電阻狀態(tài)(HRS)和低電阻狀態(tài)(LRS),分別對應(yīng)邏輯“0”和“1”。
圖16 ReRAM結(jié)構(gòu)示意圖
在存算一體中,ReRAM 利用其高低電阻狀態(tài)直接完成簡單邏輯運算和加權(quán)累加操作,無需額外的計算單元。這種結(jié)構(gòu)簡單、能耗低且讀寫速度快,非常適合高密度存儲和邊緣計算場景。然而,ReRAM 仍面臨導電細絲穩(wěn)定性和制造一致性的挑戰(zhàn),需進一步優(yōu)化以實現(xiàn)大規(guī)模應(yīng)用。作為新型存儲器的代表,ReRAM 為存算一體的技術(shù)突破提供了新的路徑。
2、磁性隨機存儲器MRAM
磁性隨機存儲器(MRAM)是一種基于磁性隧道結(jié)(MTJ)的非易失性存儲技術(shù),通過磁化方向的變化實現(xiàn)數(shù)據(jù)存儲。如圖17,其結(jié)構(gòu)由固定層、自由層和隧道層組成,其中固定層的磁化方向保持不變,自由層的磁化方向可以在外加電流或電場的作用下翻轉(zhuǎn)。隧道層位于兩層之間,通過量子隧穿效應(yīng)傳輸電流。
圖17 MRAM結(jié)構(gòu)示意圖
MRAM 的工作原理是利用自由層和固定層磁化方向的相對狀態(tài)決定電阻值:當兩層磁化方向平行時,電阻較低(低阻狀態(tài),表示“0”);當磁化方向反平行時,電阻較高(高阻狀態(tài),表示“1”)。這一特性使 MRAM 不僅具有非易失性,還具備高讀寫速度和無限擦寫耐久性的優(yōu)點,是存算一體技術(shù)的潛在硬件實現(xiàn)之一。
3、相變存儲器PCM
相變存儲器(PCM)利用材料的相變特性,通過改變存儲介質(zhì)(如鍺銻碲合金,GST)的物理狀態(tài)來實現(xiàn)數(shù)據(jù)存儲。如圖18,其核心結(jié)構(gòu)由上電極、下電極、加熱電阻層和相變材料層組成。相變材料可以在晶態(tài)(低電阻)和非晶態(tài)(高電阻)之間切換,分別對應(yīng)邏輯“1”和“0”。
圖18 PCM結(jié)構(gòu)示意圖
PCM 的工作原理基于熱控制:通過加熱電阻調(diào)節(jié)溫度,快速冷卻使材料保持非晶態(tài)(高電阻),緩慢冷卻則使其結(jié)晶形成晶態(tài)(低電阻)。這一特性不僅能實現(xiàn)數(shù)據(jù)存儲,還能直接進行簡單的邏輯運算,為存算一體提供硬件支持。PCM 具備非易失性、高速度和高存儲密度等優(yōu)勢,但由于寫入過程中的功耗較高,目前主要應(yīng)用于高性能存儲和嵌入式設(shè)備中。
存算一體技術(shù)的實現(xiàn)路徑,既包含了經(jīng)典存儲器的突破,也融入了新型存儲器的創(chuàng)新。從 NAND Flash 到 ReRAM、MRAM、PCM,每一種存儲技術(shù)都展現(xiàn)了獨特的魅力。
在經(jīng)典存儲器中,NAND Flash 憑借成熟的技術(shù)和高存儲密度,通過浮柵技術(shù)實現(xiàn)了存儲與計算的初步結(jié)合。這種技術(shù)既解決了大規(guī)模數(shù)據(jù)處理的效率問題,也為存算一體技術(shù)奠定了基礎(chǔ)。然而,隨著需求的多樣化和技術(shù)發(fā)展的瓶頸,NAND Flash 的局限性也愈發(fā)顯現(xiàn)。
新型存儲器的出現(xiàn),為存算一體技術(shù)注入了更多活力。ReRAM 以其高低電阻的切換,實現(xiàn)了簡單邏輯運算和數(shù)據(jù)存儲的雙重功能;MRAM 通過磁性隧道結(jié),提供了快速讀寫與高耐久性的解決方案;而 PCM 則利用材料的相變特性,在數(shù)據(jù)存儲和邏輯計算中表現(xiàn)優(yōu)異。它們不僅各自為存算一體的實現(xiàn)提供了可能,更在存儲密度、速度、功耗等方面進一步拓寬了技術(shù)邊界。
總結(jié)來看,無論是經(jīng)典存儲器還是新型存儲器,它們共同推動了存算一體技術(shù)的發(fā)展,打破了傳統(tǒng)計算架構(gòu)中“存儲墻”的限制。在未來,這些技術(shù)將進一步融合,為我們帶來更高效、更智能的計算與存儲解決方案。存算一體,不僅是一場技術(shù)革命,更是一場賦能未來的進化之路。
四、本土發(fā)展與海外齊頭并進:存算一體技術(shù)的全球競速
在存算一體技術(shù)的賽道上,全球產(chǎn)業(yè)格局正在快速演變,呈現(xiàn)出“本土崛起、海外領(lǐng)先”的雙軌并行趨勢。海外的技術(shù)巨頭憑借成熟的技術(shù)積累和完善的產(chǎn)業(yè)鏈,依然在市場中占據(jù)優(yōu)勢;與此同時,本土企業(yè)通過技術(shù)突破和資本加持,正奮力追趕,實現(xiàn)了從跟隨到部分領(lǐng)域引領(lǐng)的跨越。
4.1海外布局:巨頭穩(wěn)固,創(chuàng)新涌現(xiàn)
海外市場,三星、SK海力士等巨頭在 NAND Flash、ReRAM 等傳統(tǒng)存儲技術(shù)上依舊占據(jù)核心地位,其強大的 IDM(集成制造)和 Fab(代工制造)模式為高效存儲和計算一體化提供了堅實基礎(chǔ)。同時,Crossbar、Mythic 等新興企業(yè)聚焦 ReRAM 和 MRAM 等前沿領(lǐng)域,推動了存算一體技術(shù)在高性能計算和邊緣設(shè)備中的應(yīng)用。
值得注意的是,海外企業(yè)不僅擁有技術(shù)深度,還在產(chǎn)業(yè)鏈整合和商業(yè)化落地上展現(xiàn)了強大實力。三星在 NAND Flash 技術(shù)的堆疊工藝中屢創(chuàng)新高,成為存儲密度提升的全球標桿,而 IBM 等企業(yè)則積極布局 MRAM 技術(shù),用于未來人工智能計算需求。
4.2本土崛起:多點開花,彎道超車
在存算一體技術(shù)的本土化進程中,傳統(tǒng)巨頭與新興力量共同推動了國產(chǎn)存儲產(chǎn)業(yè)的快速發(fā)展。作為全球領(lǐng)先的芯片代工企業(yè),臺積電憑借其在 Flash 和 SRAM 制程領(lǐng)域的深厚積累,為國內(nèi)存儲技術(shù)提供了強大的制造支持。臺積電的先進制程技術(shù),不僅讓國產(chǎn)存儲器在全球市場中站穩(wěn)腳跟,也為國內(nèi)企業(yè)從研發(fā)到量產(chǎn)的跨越奠定了堅實基礎(chǔ)。在 3D NAND Flash 和高性能 SRAM 制程上,臺積電的技術(shù)領(lǐng)先性依然是本土企業(yè)追趕國際巨頭的重要依托。
與此同時,新興企業(yè)的崛起為本土產(chǎn)業(yè)注入了新的活力。上海昕原半導體專注于 ReRAM 技術(shù)研發(fā),是中國大陸首家實現(xiàn)先進制程 ReRAM 量產(chǎn)的企業(yè),其自建的 12 寸中試生產(chǎn)線順利通線,標志著國內(nèi)在新型存儲器技術(shù)領(lǐng)域的重大突破。昕原的 ReRAM 產(chǎn)品,不僅覆蓋終端與邊緣計算場景,還展現(xiàn)出在 AI 芯片領(lǐng)域的潛力,體現(xiàn)了技術(shù)突破與商業(yè)化落地的高度結(jié)合。與之并行的杭州知存科技則聚焦 Flash 存儲器的創(chuàng)新應(yīng)用,通過推出 WTM 系列存算芯片,在端、邊、云等多場景應(yīng)用中占據(jù)一席之地,并開始布局 MRAM 等新型存儲技術(shù),為未來高性能存儲提供了更多可能。
本土存儲產(chǎn)業(yè)的崛起,是傳統(tǒng)巨頭與新興勢力協(xié)同共進的結(jié)果。尤其上海昕原和杭州知存的快速突破,則為國產(chǎn)存儲器在細分領(lǐng)域的全球競爭中提供了更多優(yōu)勢。在傳統(tǒng)與創(chuàng)新的雙輪驅(qū)動下,本土存算一體技術(shù)正以多點開花的態(tài)勢,向國際市場發(fā)起強有力的沖擊。
圖19 存算一體技術(shù)國內(nèi)外競爭格局
4.3國內(nèi)初創(chuàng)企業(yè)概覽:存算一體領(lǐng)域的投資機會
近年來,國內(nèi)存算一體領(lǐng)域的初創(chuàng)企業(yè)如雨后春筍般崛起,在技術(shù)創(chuàng)新與市場布局方面展現(xiàn)出強勁勢頭。從傳統(tǒng)的 Flash 到新興的 ReRAM、MRAM,各類存儲器技術(shù)百花齊放,覆蓋了從終端到邊緣再到云端的廣泛應(yīng)用場景。知存科技依托 Flash 技術(shù),在端、邊、云多場景中實現(xiàn)了產(chǎn)品落地,估值已突破 29 億元;而昕原半導體專注于 ReRAM 技術(shù),率先實現(xiàn)了 28nm 工藝量產(chǎn),產(chǎn)品良率高達 85%,目前估值已超 30 億元。此外,后摩智能則在 SRAM 與 ReRAM 結(jié)合上開辟新路徑,其 H30 芯片量產(chǎn)標志著國產(chǎn)存算一體技術(shù)邁入新階段。這些企業(yè)在細分領(lǐng)域的深耕,不僅展現(xiàn)了技術(shù)創(chuàng)新的活力,也凸顯了多樣化的投資潛力。
從資本市場的表現(xiàn)來看,存算一體技術(shù)正成為新的投資熱土。這些初創(chuàng)企業(yè)的高估值和融資熱度表明,市場對存算一體技術(shù)未來的發(fā)展充滿期待。知存科技、昕原半導體等企業(yè)的成功,不僅驗證了新型存儲技術(shù)的市場價值,也為資本找到了一條聚焦高技術(shù)含量領(lǐng)域的投資路徑。對于投資者而言,存算一體領(lǐng)域正處于技術(shù)突破與規(guī)?;瘧?yīng)用的交匯點,捕捉其中的機會,將是布局未來科技產(chǎn)業(yè)的重要一步。
圖20 國內(nèi)存算一體投資機會概覽
五、城市級投資機會
全球存算一體技術(shù)的競速已經(jīng)進入白熱化階段,海外巨頭憑借技術(shù)積累和產(chǎn)業(yè)鏈優(yōu)勢保持領(lǐng)先,而本土企業(yè)則通過創(chuàng)新突破和資本加持不斷縮小差距。在這場科技競速中,區(qū)域發(fā)展逐漸成為關(guān)鍵推動力——從科研突破到產(chǎn)業(yè)集群,各地紛紛憑借技術(shù)、人才和政策優(yōu)勢塑造獨特的存儲生態(tài)。接下來,本節(jié)將聚焦區(qū)域化發(fā)展背后的城市級投資機會,探討它們?nèi)绾螢榇嫠阋惑w技術(shù)的產(chǎn)業(yè)化落地注入強勁動力。
5.1科研突破:存算一體的新動力
近年來,國內(nèi)高校在存算一體領(lǐng)域的科研表現(xiàn)可謂亮眼。如圖21所示,從清華大學的憶阻器存算一體芯片,到中科院提出的SRAM存算方案,再到南京大學的高能效存儲器技術(shù),各大高校不斷刷新著這一領(lǐng)域的技術(shù)高度。這些研究不僅停留在理論階段,已經(jīng)逐步展現(xiàn)出從實驗室走向?qū)嶋H應(yīng)用的潛力。
更值得關(guān)注的是,這些技術(shù)背后蘊藏的商業(yè)機會。比如,憶阻器存算方案的突破性進展,為人工智能芯片優(yōu)化提供了新路徑;而高能效存儲器的開發(fā),則為邊緣計算和低功耗設(shè)備奠定了技術(shù)基礎(chǔ)。這些高校的研究成果不僅指明了技術(shù)發(fā)展的方向,也為市場帶來了潛在的投資機會。存算一體技術(shù),將成為下一個產(chǎn)業(yè)風口。
圖21 國內(nèi)科研存算一體領(lǐng)域進展一覽
5.2 存儲高地:城市崛起的創(chuàng)新力量
近年來,存算一體技術(shù)的區(qū)域化發(fā)展正在加速,北京、上海、杭州、南京、合肥等城市逐漸成為存儲產(chǎn)業(yè)的重要高地。依托頂尖高校的科研實力和本地企業(yè)的技術(shù)落地能力,這些地區(qū)在存儲技術(shù)創(chuàng)新與應(yīng)用上齊頭并進。
北京以清華大學和北京大學為科研核心,不斷輸出前沿成果并轉(zhuǎn)化為產(chǎn)業(yè)優(yōu)勢;杭州的知存科技和合肥的??莆⒃贔lash與ReRAM領(lǐng)域表現(xiàn)亮眼,為存算一體技術(shù)的實際應(yīng)用開辟新路徑;南京的后摩智能和上海的昕原半導體專注于SRAM與ReRAM技術(shù),通過技術(shù)突破推動邊緣計算與AI場景的落地。
這些城市不僅是技術(shù)創(chuàng)新的熱土,也為未來存儲產(chǎn)業(yè)的規(guī)模化發(fā)展注入了持續(xù)動能??蒲信c產(chǎn)業(yè)的結(jié)合正加速產(chǎn)學研一體化,為中國存儲技術(shù)崛起創(chuàng)造了前所未有的機遇。
可以看到,各大城市正通過科研資源整合、技術(shù)創(chuàng)新與產(chǎn)業(yè)政策支持,推動存算一體技術(shù)從實驗室走向市場。從端側(cè)到云端,從高校實驗室到產(chǎn)業(yè)集群,區(qū)域化發(fā)展已成為這一技術(shù)突破的重要引擎。未來,隨著區(qū)域間協(xié)同創(chuàng)新的加速,中國或?qū){借其獨特的產(chǎn)業(yè)生態(tài),在全球存算一體技術(shù)的競爭中占據(jù)更重要的席位,為計算架構(gòu)的革命性發(fā)展注入新的動力。
六、投資邏輯與投資機會
區(qū)域創(chuàng)新的快速發(fā)展為存算一體技術(shù)的落地提供了肥沃的土壤,而這些技術(shù)突破也為投資者帶來了前所未有的機遇。從科研到產(chǎn)業(yè)化,存算一體領(lǐng)域正進入價值釋放的關(guān)鍵時期。本節(jié)將從投資邏輯出發(fā),剖析這一領(lǐng)域的潛力與方向,為布局未來科技產(chǎn)業(yè)提供思路。
6.1投資邏輯
存算一體技術(shù)作為后摩爾時代的全新計算架構(gòu),正在顛覆傳統(tǒng)的存儲和計算分離模式,其變革意義不亞于一次科技革命。隨著摩爾定律逐漸逼近極限,傳統(tǒng)芯片計算能力的提升開始放緩,而存算一體技術(shù)通過突破“存儲墻”這一瓶頸,成為未來計算發(fā)展的必然選擇。特別是在人工智能、大數(shù)據(jù)等需要高效算力的領(lǐng)域,這一技術(shù)能夠通過將計算能力融入存儲單元,顯著提升效率、降低成本,展現(xiàn)出極大的市場吸引力。
從市場潛力來看,存算一體技術(shù)的應(yīng)用場景十分廣闊,涵蓋端側(cè)設(shè)備、邊緣計算和云計算等領(lǐng)域,預(yù)計到2030年相關(guān)市場規(guī)模有望達到千億量級。這種成長性不僅體現(xiàn)出對科技產(chǎn)業(yè)的革命性推動作用,也為投資者提供了長期價值的保障。而國內(nèi)在該技術(shù)領(lǐng)域與國際差距相對較小,更具備“彎道超車”的可能性,是實現(xiàn)科技自主可控的重要突破口??梢哉f,存算一體技術(shù)承載了未來產(chǎn)業(yè)升級的希望,也成為投資邏輯中的核心支柱。
6.2投資機會
目前,存算一體技術(shù)正處于產(chǎn)業(yè)化初期,技術(shù)和工藝的成熟尚需時間,但這恰恰是投資的窗口期。國內(nèi)企業(yè)在這一領(lǐng)域表現(xiàn)出了強大的研發(fā)潛力和靈活的市場響應(yīng)能力,尤其是在制造工藝、算法優(yōu)化等關(guān)鍵環(huán)節(jié),已經(jīng)初步展現(xiàn)出核心競爭力。選擇有能力提升工藝水平、攻克制造瓶頸的企業(yè),將是發(fā)掘未來獨角獸企業(yè)的關(guān)鍵所在。
此外,存算一體技術(shù)的價值還體現(xiàn)在它能夠滿足端、邊、云等多層次市場需求,從消費端到數(shù)據(jù)中心,均有廣泛應(yīng)用潛力。特別是在端側(cè)和邊緣計算市場中,一些具備前沿技術(shù)儲備的企業(yè),已經(jīng)開始小批量生產(chǎn)并實現(xiàn)客戶導入。這樣的企業(yè)不僅能帶來短期業(yè)績增長,還將在未來幾年內(nèi)實現(xiàn)爆發(fā)式發(fā)展,為投資者創(chuàng)造超額回報。對于追求創(chuàng)新與回報平衡的投資者來說,存算一體無疑是一個值得長期布局的領(lǐng)域。
結(jié)語:打破存儲墻,賦能智慧未來
從馮·諾依曼架構(gòu)的輝煌與局限,到存算一體技術(shù)的橫空出世,我們正處在計算架構(gòu)變革的前沿。存算一體技術(shù)不僅打破了“存儲墻”這一長期制約算力發(fā)展的瓶頸,更為人工智能、大數(shù)據(jù)等領(lǐng)域注入了新動能。從智能耳機到自動駕駛,從邊緣計算到云端推理,這項技術(shù)正悄然改變我們的日常生活。
全球范圍內(nèi),各大科技巨頭和初創(chuàng)企業(yè)在存算一體技術(shù)上展開激烈角逐,而中國本土產(chǎn)業(yè)也通過技術(shù)突破和區(qū)域協(xié)同,逐步縮小差距,甚至在某些細分領(lǐng)域?qū)崿F(xiàn)超越。科研實力、資本支持與產(chǎn)業(yè)化落地的深度結(jié)合,為中國在這一領(lǐng)域贏得更多主動權(quán)提供了堅實基礎(chǔ)。
未來,存算一體技術(shù)不僅是推動科技創(chuàng)新的核心力量,更可能成為智能時代發(fā)展的重要引擎。無論是千億級市場的擴展,還是產(chǎn)業(yè)鏈的全面升級,存算一體都將書寫計算架構(gòu)的新篇章。我們站在歷史的交匯點上,見證著技術(shù)的飛躍,也迎來了全新的發(fā)展機遇。在這場通向智慧未來的旅程中,存算一體技術(shù),正在為我們打開無限可能的大門。
*參考文獻
[1]中國移動研究院. (2022). 存算一體白皮書 [R].
[2]中國信息通信技術(shù)研究院. (2021). 中國算力發(fā)展指數(shù)白皮書 [R].
[3]林鈺登. (2019). 基于新型憶阻器的存內(nèi)計算. 微納電子與智能制造.
[4]尹勛釗. (2022). 存算一體電路與跨層次協(xié)同設(shè)計優(yōu)化:從SRAM到鐵電晶體管. 中國科學.
[5]丁士鵬. (2021). 基于NOR Flash的存算一體模擬乘加電路設(shè)計. 信息技術(shù)與網(wǎng)絡(luò)安全.
[6]冒偉, 劉景寧, 等. (2015). 基于相變存儲器的存儲技術(shù)研究綜述. 計算機學報.
[7]Amir Gholami. (2022). AI and Memory Wall [Online]. Retrieved from https://medium.com/riselab/ai-and-memory-wall-2cb4265cb0b8
[8]Tanachutiwat, S., Ming, L., & Wei, W. (n.d.). FPGA Based on Integration of CMOS and RRAM [M].
[9]Tehrani, S., Engel, B., Chen, E., et al. (2000). Recent developments in magnetic tunnel junction MRAM. In IEEE International Magnetics Conference (pp. xx-xx). IEEE.
來源:投資五部 許希文
審核:薛瑤
發(fā)布:尤異
相關(guān)附件