近日,清華大學(xué)集成電路學(xué)院教授吳華強(qiáng)副教授高濱團(tuán)隊(duì)基于存算一體計(jì)算范式研制出全球首顆全系統(tǒng)集成的支持高效片上學(xué)習(xí)(機(jī)器學(xué)習(xí)能在硬件端直接完成)的憶阻器存算一體芯片。在支持片上學(xué)習(xí)的憶阻器存算一體芯片領(lǐng)域取得重大突破。有望促進(jìn)人工智能、自動(dòng)駕駛可穿戴設(shè)備等領(lǐng)域的發(fā)展!
2012年,錢鶴和吳華強(qiáng)的團(tuán)隊(duì)開始致力于研究利用憶阻器進(jìn)行存儲(chǔ)。然而,當(dāng)時(shí)憶阻器的材料和集成工藝尚未成熟,因此團(tuán)隊(duì)不斷進(jìn)行實(shí)驗(yàn),不斷摸索,希望提高器件的一致性和良率。
兩年后,清華大學(xué)、中科院微電子所和北京大學(xué)等單位合作,對(duì)憶阻器的器件工藝進(jìn)行了優(yōu)化,并成功制備出高性能的憶阻器陣列。這一進(jìn)展使得我國成為了在憶阻器陣列大規(guī)模集成方面的領(lǐng)先者。
到了2020年,錢鶴和吳華強(qiáng)的團(tuán)隊(duì)基于多陣列憶阻器,構(gòu)建了一個(gè)全硬件構(gòu)成的系統(tǒng)。他們成功地運(yùn)行了卷積神經(jīng)網(wǎng)絡(luò)算法,驗(yàn)證了圖像識(shí)別功能。與傳統(tǒng)的圖形處理器芯片相比,這個(gè)系統(tǒng)的能效提高了兩個(gè)數(shù)量級(jí),大幅提升了計(jì)算設(shè)備的算力。通過更小的功耗和更低的硬件成本,他們成功地完成了復(fù)雜的計(jì)算任務(wù)。

▲ 存算一體系統(tǒng)架構(gòu)
清華大學(xué)指出,存算一體架構(gòu)類似于新型的“在家辦公”模式,徹底減少了通勤的能源消耗,避免了往返通勤所帶來的時(shí)間延遲,同時(shí)顯著降低了辦公場所的運(yùn)營成本。這種架構(gòu)在邊緣計(jì)算和云計(jì)算領(lǐng)域具有廣泛的應(yīng)用前景。
錢鶴和吳華強(qiáng)領(lǐng)導(dǎo)的團(tuán)隊(duì)創(chuàng)新設(shè)計(jì)了適用于憶阻器存算一體的高效片上學(xué)習(xí)的通用算法和架構(gòu)(STELLAR),并成功研制出全球首顆全系統(tǒng)集成、支持高效片上學(xué)習(xí)的憶阻器存算一體芯片。

▲ 基于憶阻器存算一體實(shí)現(xiàn)高效片上學(xué)習(xí)的通用算法和架構(gòu)
“存算一體片上學(xué)習(xí)在實(shí)現(xiàn)更低延遲和更小能耗的同時(shí),能夠有效保護(hù)用戶隱私和數(shù)據(jù)。”博士后姚鵬介紹,該芯片參照仿生類腦處理方式,可實(shí)現(xiàn)不同任務(wù)的快速“片上訓(xùn)練”與“片上識(shí)別”,能夠有效完成邊緣計(jì)算場景下的增量學(xué)習(xí)任務(wù),以極低的耗電適應(yīng)新場景、學(xué)習(xí)新知識(shí),以滿足用戶的個(gè)性化需求。
什么是存算一體芯片?
存算一體芯片是一種集成了存儲(chǔ)和計(jì)算功能的新型芯片架構(gòu)。傳統(tǒng)的計(jì)算機(jī)系統(tǒng)中,存儲(chǔ)和計(jì)算是分離的,數(shù)據(jù)需要從存儲(chǔ)器傳輸?shù)教幚砥鬟M(jìn)行計(jì)算。而存算一體芯片將存儲(chǔ)單元(通常是內(nèi)存)與計(jì)算單元(通常是處理器)集成在同一片芯片上,這樣可以在芯片內(nèi)部直接進(jìn)行數(shù)據(jù)的存儲(chǔ)和計(jì)算,大大提高了數(shù)據(jù)處理的效率。
其架構(gòu)通常包括以下關(guān)鍵組件:
1. 計(jì)算單元(Compute Units):存算一體芯片內(nèi)部集成了多個(gè)計(jì)算單元,這些單元可以執(zhí)行各種計(jì)算操作,例如矩陣運(yùn)算、向量運(yùn)算和邏輯運(yùn)算。計(jì)算單元通常配備了高性能的處理器核心,用于執(zhí)行復(fù)雜的計(jì)算任務(wù)。
2. 存儲(chǔ)單元(Storage Units):存算一體芯片內(nèi)部包含存儲(chǔ)單元,通常是閃存(Flash)或其他非易失性存儲(chǔ)介質(zhì)。這些存儲(chǔ)單元用于存儲(chǔ)數(shù)據(jù)和計(jì)算所需的中間結(jié)果。存儲(chǔ)單元的高速讀寫能力對(duì)于存算一體芯片的性能至關(guān)重要。
3. 內(nèi)部互連網(wǎng)絡(luò)(Interconnect):存算一體芯片內(nèi)部有高效的互連網(wǎng)絡(luò),用于連接計(jì)算單元和存儲(chǔ)單元,實(shí)現(xiàn)數(shù)據(jù)的快速傳輸和計(jì)算結(jié)果的返回。這種內(nèi)部互連網(wǎng)絡(luò)通常被設(shè)計(jì)為低延遲和高帶寬的結(jié)構(gòu)。
4. 存算一體引擎(Computational Storage Engine):存算一體芯片通常配備了存算一體引擎,這是一種硬件模塊,用于執(zhí)行存儲(chǔ)計(jì)算任務(wù)。這些任務(wù)可以包括數(shù)據(jù)壓縮、加密解密、數(shù)據(jù)過濾和查詢等。存算一體引擎可以在數(shù)據(jù)存儲(chǔ)的同時(shí)進(jìn)行實(shí)時(shí)計(jì)算,提高了數(shù)據(jù)處理的效率。
5. 高速緩存(Cache):存算一體芯片內(nèi)部通常集成了高速緩存,用于臨時(shí)存儲(chǔ)計(jì)算過程中的中間數(shù)據(jù),減少對(duì)主存儲(chǔ)器的訪問次數(shù),提高計(jì)算效率。
6. 管理和控制單元(Management and Control Unit):這個(gè)單元負(fù)責(zé)存算一體芯片的整體管理和控制。它監(jiān)測芯片狀態(tài)、處理錯(cuò)誤,管理數(shù)據(jù)流和任務(wù)調(diào)度,確保存算一體芯片的正常運(yùn)行。
這種集成的架構(gòu)具有以下優(yōu)勢
1. 降低延遲:存儲(chǔ)和計(jì)算在同一芯片上完成,避免了數(shù)據(jù)傳輸?shù)难舆t,加快了數(shù)據(jù)處理速度。
2. 節(jié)省能源:數(shù)據(jù)傳輸通常需要消耗大量能量,存算一體芯片減少了數(shù)據(jù)傳輸,降低了能源消耗。
3. 提高性能:存算一體芯片可以實(shí)現(xiàn)更緊密的存儲(chǔ)和計(jì)算集成,從而提高整體性能。
4. 增加數(shù)據(jù)安全性:減少了數(shù)據(jù)在傳輸過程中被截獲或篡改的可能性。
當(dāng)前存算一體芯片技術(shù)面臨的主要挑戰(zhàn)包括:
1. 散熱問題:集成存儲(chǔ)和計(jì)算單元可能導(dǎo)致芯片發(fā)熱問題,需要解決散熱和熱管理方面的挑戰(zhàn)。
2. 制程技術(shù):制造存算一體芯片需要先進(jìn)的制程技術(shù),包括三維堆疊技術(shù),這些技術(shù)的發(fā)展對(duì)于存算一體芯片的實(shí)現(xiàn)至關(guān)重要。
3. 內(nèi)存容量和速度: 存儲(chǔ)器的容量和速度需要達(dá)到足夠高的水平,以滿足各種應(yīng)用場景的需求。
4. 軟硬件兼容性:存算一體芯片需要與現(xiàn)有的軟件和硬件系統(tǒng)兼容,確保平穩(wěn)過渡和升級(jí)。
5. 可靠性和穩(wěn)定性:存算一體芯片需要具備高度的可靠性,尤其是在大規(guī)模數(shù)據(jù)處理和關(guān)鍵應(yīng)用領(lǐng)域。
應(yīng)用領(lǐng)域
存算一體芯片具有高度集成的優(yōu)勢,因此在多個(gè)應(yīng)用領(lǐng)域都有廣泛的潛在應(yīng)用,包括但不限于:
1. 人工智能(AI)和機(jī)器學(xué)習(xí)(ML):存算一體芯片可以加速神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練和推斷過程,提高深度學(xué)習(xí)算法的性能和效率。
2. 大數(shù)據(jù)分析: 在大數(shù)據(jù)處理中,存算一體芯片可以更快速地處理海量數(shù)據(jù),加速數(shù)據(jù)分析和挖掘過程。
3. 科學(xué)計(jì)算和模擬: 對(duì)于需要大規(guī)模計(jì)算的科學(xué)問題,存算一體芯片可以提供更快速的計(jì)算和數(shù)據(jù)處理能力,用于模擬和分析復(fù)雜的自然現(xiàn)象。
4. 云計(jì)算和數(shù)據(jù)中心: 存算一體芯片可以提供更高效的云計(jì)算服務(wù),減少數(shù)據(jù)中心內(nèi)部數(shù)據(jù)傳輸?shù)男枨?,提高服?wù)器性能和能源利用率。
5. 邊緣計(jì)算(Edge Computing):存算一體芯片可以被用于邊緣設(shè)備,加速本地?cái)?shù)據(jù)處理,降低對(duì)網(wǎng)絡(luò)帶寬的需求,提高邊緣計(jì)算系統(tǒng)的響應(yīng)速度。
6. 虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR):存算一體芯片可以提供更高的圖形處理和計(jì)算能力,改善虛擬和增強(qiáng)現(xiàn)實(shí)應(yīng)用的性能和體驗(yàn)。
7. 自動(dòng)駕駛和智能交通系統(tǒng):存算一體芯片在處理傳感器數(shù)據(jù)、圖像識(shí)別和決策制定方面具有潛在應(yīng)用,用于實(shí)現(xiàn)更智能的交通系統(tǒng)和自動(dòng)駕駛技術(shù)。
8. 物聯(lián)網(wǎng)(IoT):存算一體芯片可以被集成到各種物聯(lián)網(wǎng)設(shè)備中,提供本地?cái)?shù)據(jù)處理和決策能力,減少對(duì)云服務(wù)的依賴,增強(qiáng)物聯(lián)網(wǎng)系統(tǒng)的智能化。
這些場景只是存算一體芯片應(yīng)用的一部分示例,隨著技術(shù)的不斷發(fā)展,其應(yīng)用領(lǐng)域?qū)?huì)進(jìn)一步擴(kuò)展和深化。
18030183032