阿里造芯這一年
其后9月云棲大會,阿里宣布成立平頭哥,并且先將“狠話”放下,正在打造一款NPU,架構設計上,性能成果就要比業內最好的AI處理器強大40倍。
此言一出,語驚四座。
然而一年之后的現在——成績單時刻——阿里平頭哥確實沒有食言。含光800,性能46倍于P4,甚至比最新一代英偉達T4,也有15倍領先。
雖然過程并非完全順風順水,但過去一年,“含光”團隊不僅完成了從無到有的跨越,更是超越了所有人的預期。
整個過程中,含光800團隊在軟硬件設計上都做了大量工作,例如做架構創新,軟件編譯器、框架、工具鏈等,后期還針對INT8數據類型進行了大量優化。
含光800芯片負責人驕旸透露,這款芯片采用自研架構,針對深度學習中使用的大量權重參數和張量數據,在支持稀疏壓縮與量化處理的基礎上,通過獨特設計的數據訪存與流水線處理技術,大大減低了I/O需求和數據的搬移。
芯片同時深度優化了卷積、矩陣乘、向量計算和各種激活函數,通過高有效的硬件資源調度和全并行的數據流處理,把AI運算的性能和能效雙雙推向極致。
另外,還集成了達摩院算法。針對CNN及視覺類算法深度優化計算、存儲密度,可實現大網絡模型在一顆NPU上完成計算。
更難能可貴的是,平頭哥團隊攻克了一系列挑戰。
例如如何兼顧性能、良率、功耗等。平頭哥在軟硬件上充分考慮了這些問題,用最短的時間完成了芯片的設計、流片整個過程,7個月完成前端設計,之后僅了3個月就成功流片。
驕旸感慨,從傳統造芯角度來看,幾乎是一個不可能完成的任務。但最終,阿里AI芯片團隊,還是創下紀錄,完成挑戰,把不可能變為可能。
這其中,自然有“007”們日日夜夜的苦功,不過也不容忽視乘風起勢的大趨勢作用。
正所謂時來天地同協力,AI時代的專芯專用需求,阿里業務場景加持優勢,都是不得不說的核心原因。
版權申明:本內容來自于互聯網,屬第三方匯集推薦平臺。本文的版權歸原作者所有,文章言論不代表鏈門戶的觀點,鏈門戶不承擔任何法律責任。如有侵權請聯系QQ:3341927519進行反饋。