大模型的數據訓練與推理都需要算力支撐,中國 2022 年算力總規模為 180Eflops,低于 2021 年美國的 200Eflops,其中智能算力 2022 年中國為 41Eflops,不及 2021 年美國的 65Eflpos,這反映了我國在大模型的數據訓練和推理算力上的差距。算力的建設是市場行為,但國家統籌推進將優化資源的利用和產業的合理布局。“東數西算”作為國家戰略部署具有中國特色,反映我國區域經濟、地理氣候特點和
能源分布的格局,政府之手的作用在東西部數據資源配置與有效應用上不是可有可無的。西部不足之處是數據中心產業配套能力薄弱和人才短缺,需要同步規劃布局數據清洗標注、數據機房產品及服務業的培育發展,延伸產業鏈上下游,在做好承接東部的溫冷數據的存算的同時,還要帶動起當地熱數據的上云服務,使西部的數據集群發展形成良性循環。
算力的布局需要處理好幾方面的關系,一是通用算力與智能算力的合理比例,通用算力以 CPU 為主,適合處理政務、智慧城市和智能客服等數據/計算密集的事務性任務;智能算力以 GPU 為主,適合做大模型的訓練,注意到在數據訓練過程中還需要算法工程師介入和微調,智算中心適于在數據源集中和算法工程師聚集地建設,不宜全面開花,動用財政資金支持的大型智算中心的建設應慎重規劃。二是自建算力與云原生算力,很多單位有自建算力的積極性,但麥肯錫報告顯示,商用和企業數據中心的服務器很少超過 6% 的利用率,通常高達 30% 的服務器帶電閑置。需要鼓勵中小企業從自購 AI 服務器搭建數據中心向采購云服務轉變,既降低成本又提高利用率,增強抗 DDoS 的能力及減碳;需要引導縣級地方政府使用省地集中建設的政務云代替獨立采購 IT 基礎設施。三是存算比例,存力與算力需配合,內存與算力合理比例是 GB/Gflops 為 1,避免因存力短缺造成算力等待而影響處理效率,據華為/羅蘭貝格報告,2020 年美國為 1:0.9,中國為 1:2.4。四是災備容量與主用數據中心存儲容量之比,數據中心需異地雙容災備份,關鍵數據實現本地雙活,2020 年當年數據災備保護占數據中心存儲投資的比例全球平均為 27.4%,而我國只有 7.8%,需重視改進。
版權申明:本內容來自于互聯網,屬第三方匯集推薦平臺。本文的版權歸原作者所有,文章言論不代表鏈門戶的觀點,鏈門戶不承擔任何法律責任。如有侵權請聯系QQ:3341927519進行反饋。