與超級電腦之爭:當雲端運算中的高效能運算 (HPC) 成真

一般來說,將應用遷移到雲端都需要大量的事前規劃,尤其是資料密集型、緊密耦合的高效能運算 (HPC) 應用程式,會為遷移規劃帶來特別的挑戰。HPC 的資料增長曾經受到運算能力限制。

但是現在有更多不同的數據源,包括感測器、攝影機和不同儀器,這種資料量的增長速度,已經超過了運算處理、網路流通量和儲存性能發展的速度,這會給 AI 和機器學習演算法帶來麻煩;因為資料處理的速度得同步跟上,演算法才能為您提供洞察。這種資料增長意味著,許多傳統的本地端 HPC 資料中心不得不開始逐步將部分應用負載遷移到雲端上面。

有鑑於此,Google Cloud 和 Data Direct Networks(以下簡稱 DDN)共同開發了一套適合HPC 的雲端檔案系統:DDN 的 EXAScaler,它是一個並行檔案系統,旨在處理共享資料集的高度並行存取模式。這種 I/O 模式是緊密耦合的 HPC 應用的典型特徵,例如天體物理學或金融領域的模擬運算。在最具挑戰性的資料密集型應用方面,DNN 正在為部署大規模資料方面,提供專業知識,而 Google 則提供全球規模的資料中心解決方案。

EXAScaler 是 DDN 品牌旗下的 Lustre 產品,Lustre 是一款開源的檔案系統,在大型的商業和研究環境中展現超過 15 年的穩定性和性能表現。Lustre 性能良好,但要將其效率達到最大化可能是個挑戰。Google 和 DDN 最近使用了頂級的 HPC 儲存基準 IO-500 來展示這個共同開發出來的系統的易用性。

在高效能運算 (HPC) 儲存的競爭中脫穎而出

IO-500 是一個新興的 HPC 儲存基準,它藉由運算一個大範圍儲存特性的評分,而不是以一個狹隘的性能​​維度(例如排序讀取性能),來捕捉 HPC 儲存系統的全貌。IO-500 競賽旨在為用戶提供實際的性能預期並幫助管理人員去選擇他們的下一個 HPC儲存系統,比賽主辦方每年都會發布兩次排名榜單:一個是 11 月在美國的超級運算大會(HPC 的首發會議)上發布,另一個是 6 月在歐洲的 ISC 上發布。

Google Cloud 的解決方案,在 IO-500 上取得了第 8 名的成績。這一次的成功表明了,不僅僅是那些擁有大量預算和豐富的專業知識的用戶,現在,任何人都可以部署高端儲存系統。

在測試過程中,幾個使用 EXAScaler 的關鍵優勢就體現出來了:

快速部署

整個 Lustre 檔案系統,包括它所使用的虛擬機器和儲存,在幾分鐘內就完成了部署,並在之後可以立即關閉。這與企業本地端的 HPC 部署形成了鮮明的對比,光是部署硬體就可能需要數週時間。

資源效率

EXAScaler 一般可以滿足 Google Cloud 區塊儲存 IOPS 和頻寬限制,這證明了 Lustre 的效率、EXAScaler 的調整和 Google Cloud 的能力。

易於設定

Google 提交了 3 個單獨的設定來評估改變客戶端、儲存伺服器和中繼資料伺服器數量的效果,而部署每個設定只需要對部署腳本進行一些修改。事實上,這種靈活性使 Google 更難縮小選擇設定的範圍,因為 Google 只受限於被分配到的資源和對 Lustre 部署方式的想像。

綜合監測

如果把使用 Google Stackdriver 的客戶端和儲存伺服器監控與原生 DDN EXAScaler 監控工具相結合的話,可以快速診斷出性能瓶頸,並提出解決方法。此外這些工具也讓 Google 發現降低系統成本的方法(例如減少配置儲存伺服器的 vCPU 數量)。

可預測的性能

雖然 IO-500 基準只需要一次執行的結果,但在測試中,也發現不同次的執行之間的基準性能極為穩定。

最後,Google Cloud 上的 Lustre 是列表上唯一一個按照需求付費的儲存系統,因此系統的實際系統成本,是以每秒計費每次的執行基準(大約一小時。如果 IO-500 有包括了每個系統的成本,那結果將會非常有趣。因為在很多情況下,「CP 值」對用戶來說,比純粹的性能還更重要。

IO-500 write bandwidth performance with three different configurations.png

在雲端執行高效能運算 (HPC) 的技巧:善用雲端彈性擴展

「市場基準」是讓您了解整體市場、在選擇 HPC 儲存時,縮小目標範圍的有效方法。然而,當你要將重要的工作負載遷移到雲端時,尤其是當你的業務都依賴這些工作負載時,有幾個關鍵因素也必須考慮。

如果你正在考慮將傳統的 HPC 工作負載遷移到雲端,首先要確定您,要遷移的應用程式及其持續性效能的要求,如此才能建立經濟、高效的混合解決方案。在雲端上執行 HPC 工作負載或許只是 HPC 軟體的提升和轉移,但這也是一個讓您根據工作負載需求,調整基礎設施的機會。

例如您可以在需要的時候擴展資源,不需要的時候縮減資源;而需要 GPU 的工作負載可以提供 GPU,不需要的工作負載就簡單地為它們客製運算資源、記憶體即可。而儲存設備同樣可以在使用時進行分配,在閒置時進行停止或取消分配。

當你在雲端上執行 HPC 時,目標應該是簡單地專注在應用本身所需的效能,並將執行工作交給 Google Cloud。例如,一個常見的儲存部署問題是,單一的並行檔案系統應該處理具有衝突要求的工作負載,例如高使用量的中繼資料或 IOPS 性能和高使用量的頻寬。針對中繼資料/IOPS 性能的改善是需要更昂貴的 SSD,而這對於僅僅需要高使用量頻寬的工作負載來說是不必要的。另外由於 I/O 請求的混合處理,同時執行兩種類型的工作負載會大幅增加兩者的執行時間。更好的解決方法是,為每一種工作負載類型客製化一個並行檔案系統,通過減少 I/O 互相搶奪使用而降低整體工作負載的執行時間,甚至可以通過利用預先設定好的儲存設備來更好地降低成本。

雖然 Lustre 已被證明可在傳統的本地端 HPC 基礎架構中進行擴展,但其適應性和展現雲端優勢的能力尚未展現,這就是為什麼 DDN 專注於在雲端上,以極大規模適應、部署和執行 Lustre。雲端上的 Lustre 將繼續提供大規模和良好的性能,但要易於管理並且不影響您在儲存上的預算。

同時使用 Google Cloud 和 DDN 可以為每個工作負載建立運算和儲存的正確平衡。對於活躍的「熱資料」,Lustre 檔案系統可以帶來高性能。對於非活躍的「冷資料」,Google Cloud Storage 可以作為一個大規模資料的歸檔,同時通過多區域、雙區域和區域類別來提供高度可用性,並通過 Standard 儲存、Nearline 儲存、和 Coldline 等不同儲存類別來降低成本。

將 Lustre 與 Google Cloud Storage 相結合,意味著熱資料可以快速處理,冷資料可以便宜地儲存起來,並在需要時迅速發揮其功用。

Compute and store data differently in Google Cloud.png

如果您在本地端執行 HPC 的工作負載,Google Cloud 上的 EXAScaler 可以幫助提前對本地端 Lustre 的部署來進行建模,以確保在訂購和部署硬體之前有適當的設定。由於工作負載的複雜性,在部署前很難知道容量、性能、頻寬、IOPS、中繼資料等等所組成的最佳經濟效益的組合。能夠快速便宜地對不同設定進行原型設計,可以確保您從一開始就能獲得良好的體驗。

雲端高效能運算 (HPC) 的下一個目標

歡迎來試用 GCP Marketplace 上,Google Cloud 和 DDN 的 Lustre 解決方案,用戶可以期待著令人興奮的新功能。

(本文翻譯改編自 Google Cloud。)