本文來自格隆匯專欄:半導體行業觀察 作者:李壽鵬
據介紹,該芯片基於Arm最新的ARMv9架構設計,採用業界最先進的5nm工藝製造,單芯片容納高達600億晶體管。具體而言,倚天710內含128個CPU內核,主頻最高達到3.2GHz,能同時兼顧性能和功耗;在內存和接口方面,倚天710集成了業界最領先的DDR5、PCIe5.0等技術,能有效提升芯片的傳輸速率,並且可適配雲的不同應用場景。
從SPECInt2017基礎測試平台的測試數據可以看到,倚天710跑分達到440分,是性能最強的服務器芯片,超出業界標杆20%,能效比優於業界標杆50%,能有效幫助數據中心節能減排。
眾所周知,過去多年來,全球公有云業務的快速發展,給相關供應商帶來了機會,隨之而來的數據中心建設也給廠商帶來了巨大的成本壓力。得益於架構本身高性能、低功耗和低成本的優勢,Arm服務器芯片在過去幾年深受雲廠商喜愛,亞馬遜旗下的AWS也通過自研的Graviton系列給客户提供提供了新選擇,國內的華為也是當中的重要參與者。此外還有Ampere computing和飛騰等一系列第三方的Arm服務器芯片供應商。
這次阿里巴巴宣佈入局這個領域,就是他們的一次重要里程碑。
據瞭解,在倚天710以前,全球所有的Arm服務器芯片(甚至放大到所有服務器芯片)都是基於7nm以上工藝打造的,換而言之,阿里巴巴“倚天710”是全球首顆基於5nm工藝打造的Arm服務器芯片。
正如前文所説,這顆芯片採用了很多最領先的技術,當中包括ARMv9、DDR5、PCIe5.0等等,這些技術都是剛剛誕生不久,而平頭哥團隊則對此做了深度定製,同時也引入了許多自研技術。而在面向服務器芯片最大的應用場景——“雲”的高併發、高性能和高能效需求,平頭哥團隊在“倚天710”上做了很多針對性的設計,將領先的芯片設計技術與雲場景的獨特需求相結合,最終實現了性能和能效比的突破。
據平頭哥方面介紹,“倚天710”是一顆從前端架構設計到後端物理實現都是自研的芯片。在這過程中,不但要求他們需要克服工藝以及IP不成熟帶來的困難,還要求他們針對雲場景的獨特要求做定製化設計,技術上保障性能、功耗的均衡。
首先,在前端設計方面;據平頭哥介紹,為了解決核數眾多條件下的帶寬瓶頸,公司對芯片的片上互聯作出特殊優化,並採用新的流控算法和降低系統反壓,有效提升了系統效率和擴展性,使單核高性能有效地轉化為整個系統的高性能。此外,通過新的系統地址到DRAM地址的轉換機制,能讓芯片擁有安全、非安全隔離、多NUMA、異常通道隔離等多種特性,同時DRAM讀寫效率大幅度提升。
來到後端物理實現方面,平頭哥團隊通過靈活調度多達30種不同EDA軟件、深度定製時鐘網絡和定製IP技術對芯片進行設計。此外,公司還採用了先進的多芯片堆疊技術,成功確保了芯片性能、功耗的優化。
如上所述,性能、成本和功耗是雲服務商及雲上企業關注的核心,而這也正是倚天710針對性設計所聚焦解決的問題。事實上他們將領先的芯片設計技術與雲場景的獨特需求相結合,也最終實現了性能和能效比的突破。此外,倚天710與阿里巴巴的飛天操作系統協同,還能為雲上客户提供高性價比的雲服務。
相關資料顯示,阿里巴巴早兩年推出的含光800已規模化部署於阿里雲,基於這顆自研芯片的阿里云為雲上企業提供了差異化選擇,目前已應用於搜索推薦、視頻直播等場景。而此次發佈的倚天710也即將在阿里雲數據中心部署,並逐步服務雲上企業。
阿里雲智能總裁、達摩院院長張建鋒表示:“基於阿里雲‘一雲多芯’和‘做深基礎’的商業策略,我們發佈倚天710,希望滿足客户多樣性的計算需求,這款芯片不出售,主要是阿里雲自用”。
“我們將繼續與英特爾、英偉達、AMD、ARM等合作伙伴保持密切合作,為客户提供更多選擇。”張建鋒進一步強調。
據介紹,目前,阿里雲已全面兼容x86、ARM、RISC-V等主流芯片架構,自研倚天710進一步豐富了阿里雲的底層技術架構,並與飛天操作系統協同,為雲上客户提供高性價比的雲服務。
對於成立於2018年的平頭哥來説,倚天710並不是他們的首款芯片,如上文談到的含光800,就是他們在2019年雲棲大會扔出來的一個芯片“重磅炸彈”。
據當時的資料介紹,含光800是阿里巴巴第一顆自研芯片,也是全球性能最強的AI芯片,性能打破了當時的AI芯片記錄,性能及能效比全球第一,在業界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比業界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。在杭州城市大腦的業務測試中,1顆含光800的算力相當於10顆GPU。
而這次倚天710發佈,對阿里巴巴有了更深層次的意義。因為這標誌着平頭哥完成了從專用到通用的轉變,突破了阿里造芯長征中的艱難一役。通用處理器芯片是數據中心最複雜的芯片之一,其架構設計複雜,對性能、功耗要求極高,尤其是高端CPU研發,幾乎是芯片設計天花板所在。長期以來,具備這一技術實力的企業寥寥可數,此前僅有Intel、AMD、AWS、華為等少數公司在此之列。阿里平頭哥問世僅3年,憑着“生死看淡、不服就幹”的勁頭突破技術瓶頸,闖入第一梯隊,實屬不易。
能在芯片領域獲得這樣的成就,始於阿里巴巴團隊從2016年開始的厚積薄發。
2016年11月,阿里投資軟件定義網絡(SDN)芯片公司Barefoot。該公司主要設計和生產可編程網絡交換機芯片、系統和軟件,曾開發出世界上第一個SDN芯片。此後,阿里巴巴又投資了翱捷科技、寒武紀、深鑑、耐能(Kneron)、中天微、恆玄科技等多家芯片公司,覆蓋AI芯片、物聯網芯片等領域。
2017年,阿里成立達摩院,其投身芯片研發的雄心日漸顯露。成立後不久,達摩院也迅速組建了一支由半導體行業工業界和學術界頂級專家組成的技術團隊,研究方向全面涵蓋系統架構、計算技術、存儲技術以及芯片工程等核心芯片設計技術。
2018年,阿里巴巴全資收購大陸唯一擁有自主嵌入式CPU IP core的中天微。按照阿里巴巴當時的説法,此次收購“基於阿里對芯片領域的長期關注和自身業務需求”,希望藉此在物聯網、人工智能等芯片競爭“新賽道”上提升中國芯片的競爭力。也就是在這一年,達摩院芯片研發團隊與中天微團隊合併成立平頭哥半導體公司,後者一躍成為全球為數不多同時擁有處理器IP及芯片設計能力的半導體公司。
得益於深厚的技術儲備,平頭哥成立短短几年內,屢創佳績。
在處理器IP方面,平頭哥核心團隊擁有十年以上的CPU IP和芯片研發經驗,長期從事自研指令集架構、CPU微體系結構與系統芯片產品的研發,累計開發了十多款玄鐵系列嵌入式CPU IP核,這些產品均已得到大規模量產的驗證,累計出貨量超過25億顆;在雲端芯片方面,背靠全球前三的雲平台阿里雲,平頭哥能深刻理解數據中心業務場景和需求,因此能夠更高效地研發業界一流的芯片,目前,平頭哥已擁有含光800 AI推理芯片、倚天710通用芯片,這兩顆芯片均實現了性能的突破。
雖然已經推出多款業界領先的芯片類產品,但阿里巴巴強調,公司未來會繼續堅持投入芯片的研發。因為在他們看來,芯片是計算系統的核心,也是所有互聯網應用、創新科技的基礎。阿里巴巴集團橫跨電商、物流、雲計算、大數據、全球化等場景,擁有世界上最挑戰、最豐富的計算場景、網絡場景、機器學習場景,需要使用大量芯片,自研芯片能夠降低阿里巴巴集團內部整體計算的成本。
與此同時,阿里雲穩居全球雲計算廠商前三、亞太第一的位置,倚天710、含光800等自研芯片還可通過阿里雲輸出給全社會,以更高的性能和更低的成本賦能更多的企業,讓企業隨時隨地可以享受到極致算力。
過去幾年,在終端需求多樣化、差異化競爭以及人工智能興起等多個因素影響下,數據中心在漸漸發生變化。傳統的服務器芯片也逐漸不能完全滿足“雲”的需求,進而興起了芯片定製化的需求。而承載了Arm架構多種優勢的Arm服務器芯片以及在特定領域擁有高性價比的AI芯片就成為了廠商追逐的目標,“倚天710”和“含光800”正是面對這些需求而生的。
對於阿里巴巴而言,這些芯片和後續的產品將完善公司做深基礎的戰略,也給公司雲服務的未來帶來巨大的想象空間。
此外,過去兩年頻發的地緣政治問題,把中國半導體的短板充分地暴露地在大家眼前。
根據知名統計公司ICinsights的報吿,統計IDM和Fabless 2020年在集成電路市場的份額,美國公司以55%的市佔率遙遙領先,緊隨其後的是韓國公司(市場份額為21%)、中國台灣公司(7%)憑藉其無晶圓廠公司IC銷售額的優勢,佔IC總銷售額的7%,比歐洲和日本公司(都是6%)高出1個百分點。來自中國大陸的公司則僅佔全球IC市場的5%。具體到CPU這個領域,差距更是明顯。
由此可見,於中國芯片產業而言,阿里平頭哥“倚天710”的發佈具有重要意義。寄望未來,相信這家極具潛力的科技巨頭將在中國芯片產業未來的崛起中扮演關鍵的角色。