對于碼字工來說,如果靈感缺乏,上極術社區溜達溜達,總會有收獲。筆者在極術社區的最新推薦欄目中,發現東數西算設施白皮書的閱讀量和下載量都非常高。作為國家級的算力工程,東數西算的未來發展備受關注。
今年開年,國家發改委聯合多部門宣布同意東數西算工程的建設,包括在京津冀、成渝、內蒙古、貴州、寧夏等八地啟動建設國家算力樞紐節點,并規劃張家口集群等10個國家數據中心集群。
數據中心是促進5G、人工智能、云計算等新一代數字技術發展的數據中樞和算力載體,助推著數字經濟的增長。對于數據中心來說,核心的構成——芯片,可謂其最為關鍵的組成部分。
數據中心作為國家數字經濟發展戰略的重要部分,其集成化、綠色化、智能化的發展,對于芯片也提出了許多要求。很多讀者都比較關心東數西算工程驅動下芯片的發展情況。
東數西算,這個大規模算力工程的實施,推動著高算力、高性能芯片的市場發展。在國際局勢的復雜變化中,對于國產芯片廠商來說,該如何突圍拿下市場呢?
01
新型數據中心的芯需求
作為數字經濟的重要“基礎底座”,數據中心在經濟和社會發展中扮演著重要的角色。同時,數字經濟的全面開啟與綠色可持續的發展需求,對數據中心提出了更新、更高的要求。《新型數據中心發展三年行動計劃(2021-2023年)》《“十四五”信息通信行業發展規劃》等在內的多份政策性文件指出,新型數據中心要從高技術、高算力、高能效和高安全四大方面出發,實現高質量發展。在政策的要求與指引下,數據中心迎來了革新,對芯片也有了新的需求。
東數西算工程是重要的新型算力基礎設施,在助力千行百業數字化轉型的過程中,芯片是基礎。數字經濟的發展離不開數據的驅動,其中涉及許多政府、金融、通信等行業的敏感數據。底層算力設施對CPU的首要需求是信息安全保障。
其次是高性能的需求。數據中心可以對數據進行集中的管理,也就是數據的交換、計算、存儲等。其中計算是數據中心的核心功能。芯片性能的提升,不僅帶來智能化與高效的服務,也能助力數據中心的綠色化發展。
據前瞻產業研究院數據,數據中心的耗能部分主要包括IT設備、制冷系統、供配電系統、照明系統及其他設施。由服務器、存儲和網絡通信設備等所構成的IT設備系統所產生的功耗約占數據中心總功耗的45%,其中服務器系統約占50%,存儲系統約占35%,網絡通信設備約占15%,空調系統產生的功耗約占數據中心總功耗的40%。我們可以看到,對數據中心IT設備服務器系統的升級對數據中心的低碳化發展意義重大。服務器性能與功耗的優化,就意味著單位能耗的降低。
最后是與其他技術的融合。比如與密碼學技術的融合,可以保障數據的安全隱私。數據中心流量的激增,安全問題的復雜程度與范圍都變大了。傳統用軟件進行加解密的計算非常消耗CPU。通過將安全技術與專用的模塊硬件或DPU連接,將過去在CPU的算法去卸載到專用引擎上,可以釋放CPU內存的同時提升加解密性能。
高性能、易融合等這些新型數據中心主要的芯需求,也為國產芯片廠商的發展勾勒出高性能芯片的大致方向。結合自身的優勢特長,芯片廠商需要在數據中心如火如荼的發展中尋求突圍。
02
競技場的突圍之路
數據中心的集成化發展,處理的數據、資源的管理任務變得復雜。這也對芯片的數據處理能力提出了要求:更大的帶寬與更大的存儲。
數據的整合傳輸、分布式計算等也是必不可少的方式。在復雜的國際局勢中,外部的供應環境多變。對于國產芯片廠商來說,要達到像國外技術標準較高的芯片水準,國產芯片廠商一方面需要在芯片底層架構的創新、制程工藝方面等方向發力。現有的指令集架構,海外巨頭更加具有優勢。在架構設計方面,國內芯片廠商還有升級增長的空間。通過底層架構的創新與制程工藝的迭代來實現計算效率的數量級提升。
一些芯片廠商趟上了這條道路。國內某芯片廠商的DPU已經流片。傳統數據中心以CPU為核心架構,DPU的出現以更專的性能滿足數據中心計算、數據處理等需求。隨著軟硬件架構的深入融合發展,DPU將會成為眾廠商爭先發展的下一代數據中心核心計算單元。
當然,現實的情況并不是所有的芯片廠商都可以完成獨立完成芯片架構設計與研發。應用成熟設計模塊的IP或產品服務也是許多企業的選擇。例如可供選擇的第三方IP企業安謀科技、銳成芯微等。安謀科技提供的IP設計與自研產品,可以為許多芯片廠商定制高性能芯片并提供服務。從手機、PC乃至排名世界第二的超級計算機富岳,都能看到基于Arm架構的高性能芯片。借助這些第三方廠商的勢能,國產芯片廠商也可以更快地迭代創新。
在數據中心處理器之外,芯片廠商的思路也可以前置到數據流入數據中心前的各大邊緣設備中,在各類邊緣處理器上發力。廠商可以考慮通過提升邊緣設備CPU性能、降低集成SOC芯片功耗等,整體提升邊緣設備計算的能力,減輕數據中心處理數據的壓力。比如在一些高功耗場景中,通過高度集成化、低功耗的設計,將各類接口集成在單芯片中,定制化算法來降低功耗;設計通用處理器作為專用設備,為一些場景提供算力服務,提升邊緣設備的算力等。
對于芯片廠商來說,也需要重視產業鏈上下游的協同。芯片產業的整體產業鏈條冗長,覆蓋的門類廣。許多國產芯片廠商,較為擅長的是芯片設計的能力,但產能方面的能力欠缺。高性能芯片行業的發展需要產業鏈上下游的協同。廠商可以選擇通過戰略合作、產品技術支持、協作項目等形式,推動行業軟硬件、解決方案、工具鏈、行業標準等生態環節的發展,最終實現促進自身的迭代。
這些突圍路徑落在紙面上討論看起來輕飄飄,對于國產芯片的發展來說,都是大山一樣的存在,難以翻越。在半導體這個行業里,市場格局一旦定型,幾乎就很難打破。每一個產業突破與難點的展開,都需要堆砌大量的資源與創新。國產芯片的突圍道阻且長。而面臨未來算力網絡的部署,也有不少的問題待解決。
03
算力網絡中的“大考”
隨著數據中心節點的部署完成,算力網絡的構建也在推進中。中國算力網智算網絡已經上線。東數西算的樞紐節點,各地的智算中心、超算中心未來都會陸陸續續并入到算力網絡中,形成一張隨時取用算力的便捷大網。
對于數據中心來說,未來分布式的數據中心節點將由算力網絡連接起來,統籌分配和調度計算任務,實現算力價值的最大化。面對復雜多變的數據跨節點傳輸與調度等,國產芯片廠商還需要解決這幾方面的問題。
供需雙方的交流與匹配。面對不同規模的數據中心與多種功能的芯片,雙方的需求信息較為模糊,芯片廠商需要解決與數據中心方溝通不充分的問題,最終實現互相匹配契合的需求與服務。
數據跨數據中心節點的調度與流動,對芯片的性能如壓縮、解壓能力的提升有一定的要求。海量的數據需要在傳輸前壓縮,在存儲前解壓,需要芯片廠商提升芯片無損壓縮的技術。
通用的邊緣算力產品方案。邊緣計算的場景多,設備多,需求量大,對CPU性能與功耗要求較高。比如面對算力要求較高的場景工業互聯網、遠程醫療、智能汽車等,芯片廠商需要提供更加通用的邊緣算力產品方案。提升邊緣設備服務器的適配性與易用性,便于實現端到端的自動化部署。
東數西算工程,會給高性能芯片市場會帶來波動,但不會帶來產能井噴式的發展。更多的層面是對芯片本身性能方面的提升,也就是從算法和硬件兩個方面的同時優化。芯片廠商需要提升自身軟硬件協同的能力。
圍繞著數據中心,東數西算工程與一體化算力網絡的建設,這些算力設施的構建帶來機遇的同時挑戰也不少,留給國產芯片廠商突圍的時間緊迫。這是場對芯片廠商的綜合大考。既要快速上馬,服務好東數西算工程,也需要在這個競技場中留下來交出答卷。這場戰役中,沒有喘息的空間。復雜多變的芯片市場,各路隊伍已經集結完畢,向著內心描繪出的藍圖開啟了沖刺跑。