HP Z8 Fury G5 : 進化的王者，生成式 AI、室內設計 GPU 加速彩現利器

2023年11月21日, 星期二

HP Z8 G4 工作站在 2017 年發表時，憑藉優異的造型設計與效能表現，被譽為「世界上最強大的工作站」，因此擄獲了不少設計領域使用者。在時隔 6 年後超越自我，推出支援最新 CPU 與 GPU 的 HP Z8 G5 Workstation，功能與效能都大幅提升，不但沿用絕美經典造型外觀，型號 HP Z8 Fury G5 更是破天荒的，竟然在緊緻機體中達成，支援四張 NVIDIA RTX A6000 的驚人之舉，這高超的工藝技術，就跟飾演鋼鐵人（Tony Stark）而紅遍全球的知名演員小勞勃道尼，在 Discovery 新節目《小勞勃道尼打造夢幻車》中，將經典老爺車改造成電動車，保留絕美經典外型，但是整個動力與操控性大幅提升，展現超凡工藝與技術能力，讓開經典老車兼顧效能與環保，有著異曲同工之妙。HP 的工程師們到底施展了什麼魔法，打造出媲美大型伺服器運算能力的 HP Z8 Fury G5，就讓小編帶您一探究竟。

打開 HP Z8 Fury G5 的側板，看到的依然是經典合金護蓋設計，簡單而俐落，打開上下護蓋之後，可以看到原本雙 CPU 設計改成了單 CPU，最高可支援到 56 核心 112 執行緒的 Intel^® Xeon^® W9 處理器。透過移動記憶體位置，將 CPU 上方空間改造成，可容納一張 NVIDIA RTX A6000 大小，加上將 CPU 下方原本匯流排空間最大化，打造出完整三張 NVIDIA RTX A6000 空間，並在原本電源供應器位置修改設計，放入了兩個 1125W 能源效率 90% 主動式 PFC 電源供應器，能提供高達 2250W 電力來支撐運算所需能量。除了縮減 CPU 數量外，其餘該有的功能一項都沒減少，16 個記憶體插槽可支援最大 2TB 記憶體容量，儲存空間除了上方兩個專屬 M.2 SSD 模組插槽，前方面板還可以安裝四合一 SSD 托架，或是兩個 3.5 吋硬碟托架，最大儲存容量可以上看 100TB 以上。前方面板可選擇標準版 4 個 USB-A 3.2 Gen 1 或是高級版 2 個 USB-A 3.2 Gen 1 和 2 個 USB-C Gen 2×2 （20Gbps），兩種版本都有耳機插孔與選配 SD 讀卡機。後方配置了 6 個 USB-A 3.2 Gen 1 與兩個 1Gb 乙太網路埠，若不是要最大化 GPU 算力（4 個 GPU），還可以額外加裝 10Gb 乙太網路卡與 SSD 擴充卡。另外值得一提的是，CPU 與記憶體具有獨立的散熱系統，搭載了 20 個溫度偵測器與 28 種風扇散熱模式，確保硬體能夠維持在最佳工作溫度，並且保有安靜的工作環境(小編測試過許多其他品牌工作站，運算滿載時所發出的噪音，都像是飛機要起飛一樣）。

AI 時代來臨、GPU 算力為王

自從 ChatGPT 在 2023 年爆紅之後，等於宣告生成式 AI 時代正式降臨，各行各業都瘋狂投入生成式 AI 相關應用開發，NVIDIA 的股價飆漲了將近 5 倍，可見 GPU 運算能力對於 AI 發展有著密不可分的關連性。動畫與設計業界在時間上相對較早接觸 GPU 運算，2012 年就已經有 GPU 渲染技術投入業界，隨著 NVIDIA RTX 技術上市，GPU 渲染已漸漸成為市場主流，原因就在於「速度」。GPU 渲染應用，早期僅侷限在「預覽」，但是現在品質已經跟 CPU 渲染平起平坐，然而 GPU 渲染速度與同價位 CPU 可以快上數十倍。隨著生成式 AI 崛起，GPU 除了運算能力之外，記憶體也變成決定勝負的關鍵因素。傳統製作流程都需要經過 3D 建模、材質、燈光與渲染這些流程，而生成式 AI 可以在概念設計期間，就提供接近渲染成品的圖像，能夠大幅減少溝通時間，但輸出尺寸若要夠大，就必須擁有更多 GPU 專屬記憶體容量，所以 NVIDIA RTX A6000 擁有 48GB VRAM 就很有優勢，而 HP Z8 Fury G5 可以同時支援 4 張 A6000 進行運算，等同於把機房中大型運算伺服器，濃縮在工作站中，使用者若想要擁有大量 GPU 算力，但不想購買伺服器與管理機房，HP Z8 Fury G5 是不二之選。

實機測試

這次評測會使用四款軟體來進行測試，都是使用本地端運算資源，生成式 AI 有兩款系統，生成圖像的 Stable Diffousion WebUI 與自建 ChatGPT 的 Text Gen WebUI。繪圖方面有 3ds Max 2024 與 Lumion 2023，都是大家耳熟能詳的老牌製作軟體。評測重點會針對運算時間、記憶體用量、畫面品質與長時間大量運算進行全面性檢驗。小編手上借到的 HP Z8 Fury G5 詳細規格如下表：

處理器：	Intel Xeon w7-3455
記憶體：	64GB
硬碟：	1TB SSD
顯示卡：	NVIDIA A6000 48GB
電源供應器：	2250W

Stable Diffusion

首先是 Stable Diffusion WebUI 的圖像生成測試，目前有 SD 與 SDXL 兩種圖像模型格式，SDXL 模型原生訓練使用較大圖片，精細度表現上會比較好，測試過程會中透過二次生成來放大原有圖像達到 2.5 倍畫質，檢視所需生成時間與記憶體用量。測試三種場景包含:室外景、室內景與人物。SD 模型生成 1024*576 的圖片時間約在 9 秒左右，放大到 2560*1440 需要 1 分 12 秒，所需記憶體最大為 27.3 GB。

SDXL 模型生成 1536*864 的圖片時間約在 12 秒左右，放大到 3840*2160 需要 3 分 08 秒，所需記憶體為 45.5GB。

目前 Stable Diffusion 經過測試發現，2560*1440 大小圖像需要耗費的記憶體（顯示卡記憶體用完後會用到系統的共用記憶體）大約是 42GB，提高到 3840*2160時會上漲到約 61.3GB，若要直接輸出 4096*4096 大小的圖像，記憶體用量測試時顯示需要到 122GB，這已經超出了一般使用者能提供的硬體規格，但若使用HP Z8 Fury G5 串接兩張 NVIDIA A6000，再加上系統共享記憶體 64GB（主機記憶體 128GB），理論上就能達成需求來完成運算。但是這樣的硬體規格踏過嚴苛，所以 Stable Diffusionu 有其他的放大替代方案，雖然會損失一些效能與細節，但能夠使用一般規格來完成工作。

Text Gen

第二項測試為使用 Text Gen WebUI 建立 ChatGPT 服務，目前有許多企業都在希望能自行建立企業內部 ChatGPT，隨著 OpenAI 與 Meta 都釋出了大型語言模型，讓許多企業用戶都紛紛投入建置。想要擁有 ChatGPT 平台其實並不難，只要安裝好 Text Gen WebUI 並且去 Hugging Face 下載語言模型，就能開始使用。這次測試是使用 TheBloke/WizardLM-33B-V1.0-Uncensored-GPTQ 這個語言模型進行建置，33B 指的是 330 億個參數，若想要做到像是 OpenAI ChatGPT 那樣豐富，模型需要達到 176B 以上規模才行，專用繪圖記憶體要求更是高達 126GB 以上，以 176B 為例就需要使用兩張 H100 或是三張 A6000 才能順利運行。但一般企業針對性資訊較多，使用小一點的模型加上Lora 理論上就足夠應付需求了。

首先測試 Text Gen WebUI 掛載模型速度與回答問題的反應能力，TheBloke/WizardLM-33B-V1.0-Uncensored-GPTQ 檔案大小為 15.7GB，載入時間為 15.18秒，平均回答反應時間為 2 秒，以這樣的反應速度來看算是相當快速，有使用過 ChatGTP 3 的讀者們，應該能感受到明顯差異（平均回答反應時間約 5~6 秒）。載入後使用 GPU 專屬記憶體為 16.7GB，測試過程順暢無錯誤。接著測試圖文生成效果，同時啟用 Stable Diffusion，讓 Text Gen WebUI 可以直接呼叫，將文字傳送到 SD 後再把圖片回傳，這功能 ChatGPT 也是近期才提供的功能。載入後使用 GPU 專屬記憶體為 22.6GB，圖片大小為 640*512，平均回應時間 5 秒，圖像無明顯錯誤，畫質優良，可見自建具有圖文生成功能，企業私有 ChatGPT 技術已經有明顯突破。

3ds Max 2024

第三項測試使用 3ds Max 2024 搭配 V-Ray 6 來進行渲染測試，由於 AI Denoise 技術已經相當成熟，渲染工作已經不需要像過去一樣，CPU 渲染一張 4K 效果圖，都需要運算 10~20 個小時，若使用 GPU 運算加上 AI Denoise 技術，則一張 4K 效果圖運算時間可以縮短到幾十分鐘以內，透過 AI 技術輔助確實可以更快得到設計師想要的結果。

這次使用的場景檔案為 Evermotion 所購買的室內場景，測試渲染 3840*2160 大小圖像，使用 GPU 渲染並搭配 NVIDIA AI Denoise 技術，渲染運算時間設定為5 分鐘，實際完成時間為 10 分鐘 42 秒（加上 AI 運算的最終時間），從圖像上可以看到畫質相當精細，沒有明顯錯誤與矂點，完全可以取代 CPU 渲染，運算期間 GPU 專屬記憶體用量為 34.6GB，使用 GPU 運算時，若要維持產生 4K 圖像渲染運算速度，記憶體大小是無法逃避的一個門檻。

AI Denoise 4K 原圖

Lumion 2023

Lumion 2023 這個版本也順應市場潮流，加入了硬體 RTX 技術，讓呈現效果更上層樓，同時也搭載了 Denoise 功能，可以有效減少取樣次數，以更快速度達到所需圖像品質，對於室內設計師們來說，光線與陰影效果更精準真實，才能將最美的設計呈現給客戶觀看。在安裝 Lumion 時發現一個有趣的狀況，Lumion 下載的安裝檔大小為 27.8GB，安裝後檔案大小達到 62.5GB，原廠為了讓安裝過程更快速完成，解壓縮時特地善用了 GPU 運算能力，雖然檔案量很大，也可以在很短時間內完成安裝。安裝後執行 Lumion 2023 硬體效能測試，借測的這台 HP Z8 Fury G5，所有項目都拿到了滿分評價。

所使用的測試場景與第三項相同，但場景材質重新使用 Lumion 內建材質指定，確保成像畫質能夠最佳化。場景資料量顯示為 17.4 百萬個，算是中型場景，一般室內設計場景大概都會落在 12~24 百萬這範圍內。測試渲染 3840*2160 圖像所需時間，採樣 64 次不使用 RTX 功能，所需計算時間為 16 秒，開啟 RTX 功能後上升為 42 秒，以下是圖像比較。

雖然開啟 RTX 功能後計算時間增加了 26 秒，但是光影效果變得更加柔和與真實，相較於其他渲染軟體都是以分鐘為單位起算，使用了 RTX 功能還是非常有價值。

RTX OFF 4K 原圖

RTX ON 4K 原圖

為什麼值得推薦

NVIDIA CEO 黃仁勳經常在演講時提到一句口號「買越多省越多」，每次台下聽眾都會被逗笑了，但這真的不是一句玩笑話，以現在 CPU 與 GPU 運算能力相比，GPU 真的是買越多省越多。但買越多就需要越多工作站或伺服器環境，才有辦法驅動這龐大算力，加上現在軟體授權費用也水漲船高，許多常用軟體工具都採取租賃方式，每年每一台工作站都需要不斷付費，而 HP Z8 Fury G5 以一台工作站大小，就能提供四張 NVIDIA A6000 良好工作環境，對於想要一次到位頂級運算效能，或是預留為來擴充 GPU 運算能量，同時還能節省軟體授權費用，HP Z8 Fury G5 都是市面上絕無僅有的存在，想要在後疫情時代脫穎而出嗎? 那就絕對不能錯過，這款年度最佳、外觀、效能與性價比三冠王的 HP Z8 Fury G5。