Home新聞新聞RISC-V 準備好用於超級計算了嗎?

RISC-V 準備好用於超級計算了嗎?

該行業似乎認為開放指令集架構是一個真正的目標。

直到幾年前,RISC-V處理器被認為是特定功能的輔助處理器,現在似乎正在獲得支持,擔任完全不同的角色──高性能計算。

目前仍處於討論階段。人們仍然對軟件生態系統存在疑問,以及芯片、板卡和系統是否足夠可靠。還存在商業和技術問題,其中商業問題是最困難的。但這表明了RISC-V架構的動力,由於其開放的ISA,它的採用和實驗出現了大規模的增長。這反過來使該行業有自由進行創新。

“Codasip”的首席市場營銷官魯珀特·貝恩斯表示:”吸引人的並不是ISA(指令集架構)本身,而是您圍繞它建立的東西。因此,圍繞安全性的工作組、發布最佳實踐、指南和參考架構等工作組至關重要。開放的根信任源”Open Titan”因為它是一個做得很好的參考架構,所以很重要。人們可以看看它,不必重新發明輪子,也許還能犯錯誤。”

現在的重要問題是這個架構可以在多大程度上朝新方向發展。芯片行業已經堅定地進入了特定領域計算的時代,其中處理器可以根據特定任務進行高度定制,然後在這些任務上表現出比其他固定架構更好的性能。但這也可能使軟件的移植變得更加困難,如果該軟件需要針對這些定制核心進行優化。

對於RISC-V來說,高性能計算和超級計算可能代表著巨大的飛躍。超級計算機被定義為性能高於通用計算機的計算機。這些通常是帶有向量擴展的浮點機器,目前的領導者Frontier在LINPACK基準測試中能夠運行約1.1艾克斯浮點運算(exaFLOPs)。它有8,730,112個基於x86 ISA的處理核心。

然而,隨著其他替代方案的廣泛應用,對於這類龐大計算機的需求一直在演變。高性能計算曾經是一台定制的多用途計算機。如今,每個人都可以部署高速伺服器集群,無論是在本地部署還是在雲端,都能提供非常相似的功能。

是否RISC-V在這方面有潛力,需要從多個不同的角度進行考慮。誰可能需要基於RISC-V架構的超級計算機,誰願意為此付費?RISC-V ISA和擴展是否具備建立超級計算機所需的所有必要功能?是否有人創建了性能合適的核心?是否已經具備了所有必要的軟件?

跟隨Arm的腳步

直到最近,大多數超級計算機都基於Intel的x86架構。Arm希望提高在高性能計算領域的滲透率,並在2016年左右準備好了基本的硬件支持。

Synopsys公司的研究員羅伯·艾特肯(Rob Aitken)表示:“當第一批Arm超級計算機項目開始時,Arm還不準備好,這是指整個生態系統尚未完全成熟,或者所有問題都已經解決。更多的是某個地方的某個人表示,已經足夠接近,我願意冒險一試。我願意嘗試一下。我會說,RISC-V現在已經達到或非常接近某個點,某個人將願意冒險,為超級計算機構建一些東西。”

2020年6月22日,由Fujitsu的48核A64FX SoC提供動力的日本富岳超級計算機,成為首個榮登全球最快計算機(至少暫時)的Arm超級計算機。可以在TOP500列表中找到最強大的高性能計算機的列表。

性能不是唯一的考慮因素。Arm基礎架構部門高性能計算和工具的高級總監David Lecomber表示:“要成為一個成功的高性能計算機處理器,需要同時提供性能、效能和安全性,同時支持一個應用生態系統和重要的領先服務器標準。在設計靈活性方面,關鍵是將靈活性提供給最適合開發人員的地方。例如,對商業高性能計算開發人員來說,穩定一致的指令集架構(ISA)至關重要,但在內存子系統(DDR5、HBM、CXL連接)或加速器(芯片內或PCIe/CXL連接)的自由設計靈活性也很重要。”

 

最快意味著什麼?

過去幾年,性能指標在行業中一直在變化。儘管絕對性能仍然佔主導地位,但系統通常受到功耗的限制,這導致特定任務優化的架構。但這也引發了如何衡量性能的問題,因為沒有一台機器可能在每個任務上都是最快的。

多年來,行業一直使用LINPACK基準測試,但這越來越具有爭議性,並且無法提供簡單的答案。一種方法是擴展基準測試,這被稱為HPC Challenge基準測試套件。其中一位創始人,田納西大學計算機科學教授傑克·東加拉(Jack Dongarra)受到美國政府的委託從事此項工作。但解決一個問題又帶來了另一個問題。該基準測試不再產生單一數字,這使得比較變得困難。

出於其他原因,性能很難衡量。吞吐量和延遲常常相互對立,這不僅限於超級計算機。因此,一個系統可能能夠更快地產生一個答案,但另一個系統可以在更短的時間內產生一系列答案,即使你必須稍等一下第一個答案。

隨著現在的應用能夠在商業雲上擴展到超過100萬個核心,構建一個巨大的高性能計算機已不再是問題。關鍵是時間到達結果,對於需要盡可能接近實時結果的任務尤其如此。這意味著在像金融交易這樣的任務中,HPC可能仍然會被使用,即使稍微提前一點的勝利也意味著你贏得了,對手輸了-有時牽涉到巨大的資金。

平衡系統

建造任何計算機都需要合理平衡多個因素。阿特瑞斯IP公司解決方案和業務發展副總裁Frank Schirrmeister表示:“在HPC中,通常專注於時鐘速度、核心數量、核心與相關互連的可擴展性等因素。但記憶體帶寬、功耗效率以及能夠添加自己的向量指令同樣重要。”

這必須被視為數據流問題。Synopsys公司的Rob Aitken表示:“數據起始於某個地方,必須從記憶體加載到處理器中,由處理器或加速器處理,然後放回記憶體中。整個路徑中存在瓶頸。‘非核心’是其中的關鍵部分,記憶體系統是其中的關鍵部分。在解決特定任務時,您必須確定系統架構中的瓶頸所在。這與CPU無關。在企業領域,世界正在研究RISC-V並解決此問題,但可能還沒有完全成熟。”

在許多情況下,真正的創新發生在非核心部分。阿特瑞斯公司的Frank Schirrmeister說:“在叢集中,您有許多相互連接的處理器。這就是您必須考慮核心的可擴展性的地方,這意味著需要對核心和互連進行協同優化。RISC-V使您能夠在這個層面上進行創新,可能比一些標準授權更好。但這需要很多工作,絕對不是簡單的。這是集成叢集時將如何運作的神秘醬汁的一部分。”

如今,許多任務(如AI / ML)都由定制加速器驅動,通用核心可能只執行調度和協調任務。Ventana公司的副總裁Travis Lanier表示:“您將不得不使用特定於領域的加速器或使用各種加速器來處理這些數據中心所需的日益增長的計算。您無法僅依靠通用CPU完成這一點。”

其他人也持相同觀點。Arm公司的David Lecomber表示:“核心性能是基本要求。HPC-ready CPU需要良好的核心向量性能和記憶體帶寬。同樣重要的是,HPC-ready CPU需要提供高效性。開發人員需要編程效率,以從可用核心和加速器中提取最佳性能。機架級和數據中心的功耗效率正在成為一個限制性的設計和運營因素。”

性能不僅僅依賴於硬件。將軟件移植和優化到特定硬件可能需要很長時間,這需要正確的生態系統支持。Schirrmeister補充道:“Arm在準備生態系統方面非常聰明。生態系統圍繞不同的架構(如x86、ArmV9和現在的RISC-V)展開。這些生態系統通常需要一段時間才能準備好並得到全面支持。所有這些都需要時間來開發和穩定。我會說對於RISC-V來說,現在可能還處於早期階段。是的,動力很大,可能比過去更快地發展。RISC-V受益於Arm的經驗,因為您可以從他們的經驗中學到一些東西。”


產業支持

顯然,在使RISC-V適用於HPC方面還有工作要做。為了促進討論和必要的工作,RISC-V聯盟成立了一個專門研究高性能計算(SIG-HPC)的特別利益小組。該小組的目標是滿足HPC社區的需求並對齊RISC-V指令集架構。根據他們的網站,他們首先明確了範圍定義,然後對SIG-HPC的興趣進行了排名,以提供高影響力的結果,從發現和差距分析到實施。為了實現這一目標,需要兩件事情-制定成為競爭對手的路徑,並擴展該路徑以在社區中引領新功能和能力。

同時,行業中正在發生許多事情,展示了幾家公司的發展方向。英特爾在巴塞羅那超級計算中心進行了大量投資。它宣布將向研發RISC-V處理器和超級計算的新實驗室投資4億歐元。然而,英特爾超級計算部門的副總裁兼總經理Jeff McVeigh在相關新聞稿中表示,“對於HPC而言,RISC-V仍然需要多年的時間。”

他們的目標是在五年內建造“zettascale”級別的系統,這比當今的超級計算機快了數個數量級。

另一家高性能處理器開發商MIPS去年宣布轉而開發使用RISC-V的處理器。MIPS宣布推出了基於RISC-V指令集架構的首款核心,目前正在為汽車駕駛輔助系統和自動駕駛等應用進行授權。但MIPS表示,該處理器核心也可用於數據中心、存儲和高性能計算。

就像軟件開發一樣,完成90%只是完成一半。正如貝爾實驗室的Tom Cargill曾經著名地說過:“代碼的前90%占開發時間的前90%。剩下的10%代碼占開發時間的另外90%。”


Related
RISC-V Decoupled Vector Processing Unit (VPU) For HPC
“Vitruvius+: An Area-Efficient RISC-V Decoupled Vector Coprocessor for High Performance Computing Applications” published by researchers at Barcelona Supercomputing Center.
RISC-V Targets Data Centers
Open-source architecture is gaining some traction in more complex designs as ecosystem matures.