By accepting you will be accessing a service provided by a third-party external to https://www.incgmedia.com/
從 GI 到 AI,華碩大量運算有夠 High! ASUS ESC4000 G4S + NVIDIA Tesla P100
從 2011 年 ESC4000 問世以來, ASUS 在 GPU 運算的技術投入,在國內一直保持領先地位,也幫助許多國內外客戶組建超級電腦,多次入圍 Top 500 與 Green 500,技術能力深得客戶信賴。這次小編很開心有這機會能再次借測到最新一代機型「ESC4000 G4S」,並搭配四張目前地表能買的到( 傳說中有更新的型號,但目前很難看到),堪稱運算能力最強悍的 NVIDIA Tesla P100,許多國外媒體測試數據都令人驚艷,不知道這次在 GPU 算圖是否也能有相對表現,就讓我們一起看下去。
測試平台規格:
CPU |
Xeon Gold 6130( 16C32T 2.10 GHz) |
RAM |
96GB(8GB * 12) |
顯示 | NVIDIA Tesla P100 * 4 |
硬盤 | 512 GB SSD |
動力 | 1 + 1 1600W 80 Plus |
不能免俗的讓我們先來看一下硬體配置:
ASUS ESC4000 G4S 能夠搭載 intel 最新 Xeon Scalable 系列 CPU,並支援雙 CPU 配置,RAM 最大能支援 16 條 64GB DDR4 2666,最大可擴充容量達到 2048GB,主機板使用 Intel C621 晶片組,除了前方八個 2.5 吋硬碟槽之外,還可以安裝一片 2280 的M.2 SSD,電源方面延續之前的設計,採用 1+1 1600W 80 PLUS,確保在全功率運轉下能安全無虞。
更靈活的資源配置
ASUS ESC4000 G4S 搭配 NVIDIA Tesla P100,除了最直接的用途,使用 GPU 運算之外,也可以搭配 VM 使用 VDI 技術,讓原本一部機架型伺服器,服務更多需要繪圖功能的設計師。讓我們先來模擬一下一般使用者的工作環境。假設有一家知名建築師事務所,擁有七名建築師與十名設計師,為了讓工作能順利在團隊中運作,每一位的工作站配備都必須相同等級,以一部單 CPU 單 GPU 中階工作站來計價,價格帶會落在十到二十萬之間,耗電量約 700 瓦特,十七台工作站以最低金額也要付出一百七十萬,耗電量更是驚人的 11900 瓦特。但是每一位使用者真的都會同時使用到這些資源嗎? A 建築師正努力使用 CAD 軟體繪製平面圖,B 建築師正在上網查資料,C 建築師正與甲設計師討論大圖輸出的細節,乙設計師正在幫 D 建築師算大圖,而 D 建築師工作站開著但不在位置上……..,諸如此類的情況相信大家都不陌生,除非有設定電腦資源閒置時開放當礦工(應該不太可能才對….),不然這些資源與能源正在被浪費掉。但是透過 VDI 的方式就能徹底改變這些狀況,資源能更有效被分配,早期單一使用者無法對應多 GPU 的限制也被解決了,不但能夠讓單一使用者獲得超過原本工作站的運算效能,還能減少軟體授權需要的套數,雖然建置硬體的費用跟原本相差不大,但在安全性、軟硬體資源分配與能源消耗上卻有非常大的優勢,畢竟在這油電雙漲的年代,該省的還是要省啊!!
VDI (Virtual Desktop Infra- structure)
虛擬桌面架構聽起來很抽象,但實際上就是虛擬主機的意思,透過網路的方式讓各種不同的終端設備,例如手機、平板、筆電或是PC,硬體效能達到工作站等級的一種使用方式,機房配置高規格伺服器,將硬體資源透過虛擬主機系統,模擬成數台或數十台工作站,再搭配vGPU( 虛擬化GPU) 技術,讓每一台虛擬主機都能擁有電腦繪圖能力。
本次測試是使用 V-Ray Next Beta 3 搭配 3ds Max 2018 來進行,為什麼要使用 V-Ray Next Beta 3 呢? 因為 V-Ray 是目前全球設計產業最多人使用的渲染引擎,而這一代的 V-Ray 號稱 CPU 與 GPU 算圖結果會是相同的(小編對於原廠這種說法持保留態度),而且又能夠在同一平台上同時測試兩種不同資源運算效能,所以在結果呈現上會有較為準確的效果。
測試規格:
型號 |
NVIDIA Tesla P100 |
CUDA 核心數 | 3584 |
記憶體 | 16GB CoWoS HBM2 |
ECC 支援 | 有 |
功耗 | 250W |
意外小插曲:
在剛安裝完軟體後,打開 V-Ray 的硬體配置工具,赫然發現視窗內空空如也,四張 Tesla P100 不知在何處,僅有C++語法支援CPU可使用,原本以為是顯示卡驅動問題造成,後來發現是要安裝 intel OpenCL 驅動程式,安裝後就會看到四張 P100 與OpenCL 語法支援 CPU,看來 intel 對於 CPU 偕同 GPU 運算這方面,算是動作頻頻,NVIDIA 有需要再更加緊研發腳步啊!
測試一:不同的 GI 引擎表現 - Brute Force
想要考驗硬體運算能力? 那就透過算圖吧! 尤其是 GI 這種光線不停在空間中彈跳、衰減與染色,最終成像美不美,選對 GI 引擎就先贏在起跑點了。第一組測試圖像大小為1400 X 800,CPU 與 GPU 都使用 Progressive 方式演算,最大採樣次數為 20 ( 計算總數為四百次, 但 GPU 每次進位都以 16 為基數,所以 GPU 採樣設定要乘上 16,故總數為 6400 次), GI 採樣使用 Brute Force,完全靠運算實力來成像。 CPU 使用時間為 23 分 44 秒, GPU使用時間為 9 分鐘整,讓我們來比較看看畫質。
上圖為 GPU Bruce Force 與 GPU Bruce Force + DeNoise ( 9 分 0 秒)
測試二:不同的 GI 引擎表現 - Light Cache
CPU 使用 1 小時 45 分 33 秒,GPU 使用 1 小時 01 分 22 秒,圖像品質跟第一組測試結果差不多,算圖時間也與第一組測試接近,表示 V-Ray 在採樣技術上已趨近成熟,如果還想要更快得到渲染作品,以目前硬體環境配置來看,增加 GPU 這個方案較為可行,因為多 CPU 的設備費用增加速度是非線性的,增加一倍 CPU 所要付出的代價可能是原來的兩三倍,但 GPU 只需要搭配適合硬體就能擴充,面對硬體效能需求越來越高,4K、8K 影像需求越來越多,想要應付生態環境變化,硬體設備提升顯然是條不歸路。
為什麼值得推薦
過去 Render Farm 大多都是由 CPU 硬體所組成,而 VDI 的設計原理是共享 CPU 核心,這兩者理念剛好背道而馳,但是透過 GPU 技術加持之下,運算不再需要大量 CPU 資源,而能夠配置大量 GPU 的伺服器規格,ASUS 正站在這個時代的浪頭上,不論是這次評測的 ESC4000 G4S,或是更高規格的 ESC8000 G4(8 GPU),面對使用環境越來越多元化( VDI 也可以使用手機操作),競爭越來越激烈,趁早規畫讓使用環境這樣一套超強競爭力的,相信才是有遠見的企業家該思考的方向。
-本文出自映CG雜誌第三十五期硬體評測