華為發布AI訓練集群Atlas 900:全球第一 相當于50萬臺PC的計算力

發表時間:2019/9/18   來源:天極網IT新聞頻道   作者:
[導讀] 今日(18日),在上海舉行的第四屆華為全聯接大會上,華為輪值董事長胡厚崑正式發布了華為智能計算戰略以及全球最快的AI訓練集群Atlas 900。
  根據胡厚崑的介紹,Atlas 900是當前全球最快的AI訓練集群,由數千顆昇騰處理器組成。在衡量AI計算能力的金標準ResNet-50模型訓練中,Atlas 900只用了59.8秒就完成了訓練,這比原來的世界記錄還快了10秒。Atlas 900總算力達到256P~1024P FLOPS @FP16,相當于50萬臺PC的計算能力。

  胡厚崑表示,Atlas 900的強大算力可廣泛應用于科學研究和商業創新。比如天文探索、石油勘探等領域,都需要進行龐大的數據計算和處理。

  胡厚崑還分享了一個由華為聯合上海天文臺與SKA共同打造的天文探索案例。天文研究高度依賴于海量的數據分析和計算,離不開超強的算力支持。在這張南半球的星空圖上有20萬顆星星,用人眼是看不見這么多星星的,這些畫面來自于SKA射電望遠鏡的數據。

  胡厚崑表示,“當前條件下,天文學家要從這20萬顆星星中,找出某種特征的星體,相當困難,一個天文學家需要耗費169天的工作量,才能完成這項工作。現在用上Atlas 900,只用10秒,就從20萬顆星星中檢索出了相應特征的星體。”

  Atlas 900 AI訓練集群技術特色:

  在AI算力方面,Atlas 900 AI訓練集群采用業界單芯片算力最強的昇騰910 AI處理器,每顆昇騰910 AI處理器內置32個達芬奇AI Core,單芯片提供比業界高一倍的算力([email protected])。Atlas 900 AI訓練集群將數千顆昇騰910 AI處理器互聯,打造業界第一的算力集群。

  昇騰910 AI處理器采用SoC設計,集成“AI算力、通用算力、高速大帶寬I/O”,大幅度卸載Host CPU的數據預處理任務,充分提升訓練效率。



  在集群網絡方面,Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯方式,百TB全互聯無阻塞專屬參數同步網絡,降低網絡時延,梯度同步時延縮短10~70%。

  在AI服務器內部,昇騰910 AI處理器之間通過HCCS高速總線互聯;昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術互聯,其速率是業界主流采用的PCIe 3.0(8.0Gb/s)技術的兩倍,使得數據傳輸更加快速和高效。在集群層面,采用面向數據中心的CloudEngine 8800系列交換機,提供單端口100Gbps的交換速率,將集群內的所有AI服務器接入高速交換網絡。

  獨創iLossless 智能無損交換算法,對集群內的網絡流量進行實時的學習訓練,實現網絡0丟包與E2E μs級時延。

  系統級調優方面,Atlas 900 AI訓練集群通過華為集合通信庫和作業調度平臺,整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強大性能。

  華為集合通信庫提供訓練網絡所需的分布式并行庫,通信庫+網絡拓撲+訓練算法進行系統級調優,實現集群線性度>80%,極大提升了作業調度效率。

  在散熱系統方面,Atlas 900 AI訓練集群采用全液冷方案,創新性設計柜級密閉絕熱技術,支撐>95%液冷占比。單機柜支持高達50kW超高散熱功耗,實現PUE<1.1的極致數據中心能源效率。

  另外,在空間節省方面,與8kW風冷機柜相比,節省機房空間79%。極致的液冷散熱技術滿足了高功率、高密設備部署、低PUE的需求,極大地降低了客戶的TCO。
投稿 打印文章 轉寄朋友 留言編輯 收藏文章
  期刊推薦
1/1
轉寄給朋友
朋友的昵稱:
朋友的郵件地址:
您的昵稱:
您的郵件地址:
郵件主題:
推薦理由:

寫信給編輯
標題:
內容:
您的昵稱:
您的郵件地址:
 

电脑外设店现在赚钱吗