在全球超級計算領域的激烈競爭中,中國的“神威·太湖之光”曾憑借其卓越性能,連續四次榮登世界超算TOP500榜首,成為國家科技實力的重要象征。它不僅是一臺運算機器,更是中國在核心芯片與系統軟件自主研發道路上的里程碑。本文將深入探秘其背后的軟硬件研發故事與技術突破。
一、硬件基石:從“申威”處理器到自主互聯架構
“神威·太湖之光”的核心驅動力,是其搭載的40,960顆中國自主研發的“申威26010”眾核處理器。這款處理器采用獨特的片上融合眾核架構,單個處理器集成了260個計算核心,實現了極高的計算密度和能效比。其設計摒棄了單純依賴商用IP核的路徑,從指令集架構到微結構實現均堅持自主創新,確保了在核心技術上的自主可控。
在系統互聯方面,研發團隊構建了高帶寬、低延遲的自主網絡——“神威網絡”。它采用層次化、可擴展的拓撲結構,有效支撐了千萬核心規模下的高效并行計算,解決了超大規模系統通信的瓶頸問題。整機系統通過創新的水冷技術進行冷卻,在實現每秒12.5億億次峰值計算性能的保持了優異的能效表現。
二、軟件靈魂:適配自主硬件的系統生態構建
硬件的高性能必須通過軟件才能釋放。為此,研發團隊打造了一整套與之深度適配的軟件棧。
首先是“神威睿智”操作系統。這是一個基于Linux深度定制的高性能計算操作系統,針對申威處理器架構進行了大量優化,并強化了大規模作業調度、系統容錯與安全管理能力。
在編譯與編程環境方面,團隊研發了支持自主指令集的編譯器、數學函數庫及并行調試工具。尤為重要的是,他們開發了適應眾核架構的并行編程模型和框架,幫助科研人員將應用高效地映射到海量計算核心上,降低了國產平臺的使用門檻。
三、應用驅動:軟硬件協同釋放算力潛能
“神威·太湖之光”的成功,最終體現在其對重大科學和工程問題的解決能力上。其軟硬件研發始終以應用需求為導向。在氣候模擬、航空航天、生物醫藥、新材料設計等領域,國家超算無錫中心與各領域科學家緊密合作,對關鍵應用進行深度優化與并行化改造,誕生了多項獲得“戈登·貝爾獎”提名的突破性應用。例如,其曾成功完成高達千萬核心規模的全球大氣動力學模擬,驗證了系統極致的可擴展性與穩定性。這種“應用-系統-芯片”的協同創新與迭代模式,構成了其成功的閉環。
四、啟示與展望:自主之路的傳承與演進
“神威·太湖之光”的研發歷程證明,在超算這樣的戰略領域,堅持全技術鏈的自主創新是可行且必要的。它不僅提供了強大的算力,更錘煉了一支涵蓋芯片、體系結構、系統軟件、應用優化的完整研發隊伍,積累了寶貴的技術體系與工程經驗。
如今,新一代的E級(百億億次)超算競賽已經開啟。從“神威·太湖之光”中孕育的技術積累與人才團隊,正繼續向著更先進的自主處理器架構、更智能的算力調度與編程模型、更廣闊的人工智能與科學計算融合應用邁進。它的故事,是中國超算從“跟跑”“并跑”到在某些方面實現“領跑”的生動縮影,其承載的自主創新精神,將持續照亮中國高端計算基礎設施的未來發展之路。