HPC 向けの新しい Azure HX/HBv4 仮想マシンを使用して、より少ないリソースでより多くのことを実現
2022 年 11 月 10 日に投稿済み
Joe Greenseid、Azure HPC 担当プリンシパル プロダクト マネージャー
本記事は以下ブログ投稿の翻訳記事です。
この記事は、Azure HPC 担当シニア プロダクト マネージャーの Jyothi Venkatesh、および Azure HPC 担当テクニカル プログラム マネージャーの Fanny Ou と共同執筆したものです。
次世代の HPC 用途専用 Azure 仮想マシン
このたび、マイクロソフトは 2 種類の新しい仮想マシン (VM) を発表します。この 2 種類の仮想マシンは、Azure HPC のすべてのお客様に、より高いパフォーマンス、さらなる付加価値のあるイノベーション、より優れた費用対効果を提供します。このまったく新しい HX シリーズおよび HBv4 シリーズの VM は、近日中に米国東部リージョンで利用可能になり、その後、米国中南部、米国西部 3、および西ヨーロッパ リージョンでも利用可能になります。これらの新しい VM は、数値流体力学 (CFD)、有限要素解析、フロントエンドおよびバックエンドの電子設計自動化 (EDA)、レンダリング、分子動力学、計算地球科学、気象シミュレーション、AI 推論、金融リスク分析などのさまざまな HPC ワークロード向けに最適化されています。
最も重要な部分で HPC のお客様を支援する革新的なテクノロジ
HX/HBv4 VM は、パフォーマンスを最大限に高めながら HPC の総コストを最小限に抑える、以下のような新しい革新的テクノロジを利用して動作します。
- 第 4 世代 AMD EPYC™ プロセッサ (プレビュー、2022 年第 4 四半期)。
- 近日中にリリース予定の AMD EPYC プロセッサ (コードネーム: “Genoa-X”。2023 年上半期の一般提供開始より)。
- 800 GB/秒の DDR5 メモリ帯域幅 (STREAM TRIAD)。
- パブリック クラウド上で初となる 400 GB/秒のNVIDIA Quantum-2 CX7 InfiniBand。
- 80 GB/秒の Azure 高速ネットワーク。
- 12 GB/秒 (読み取り) および 7 GB/秒 (書き込み) のストレージ帯域幅を実現する PCIe Gen4 NVMe SSD。
以下のグラフは、第 4 世代 AMD EPYC プロセッサを使用した HBv4/HX シリーズ VM プレビュー版の先行ベンチマーク結果を示したものです。このベンチマークは、HPC に関わる各種の一般的なアプリケーションおよび領域にわたって実行されました。このパフォーマンス情報には比較のために、Azure においてこれまで最新だった H シリーズ (Milan-X プロセッサ搭載の HBv3 シリーズ) のパフォーマンスが含められています。また、多くのオンプレミス データセンターで一般的に見られる、4 年前に製造された HPC 最適化サーバーのパフォーマンスも含められています (ここでは、それに相当する Skylake プロセッサ搭載の Azure HC シリーズによって示されています) 。
図 1: HBv4/HX シリーズ (プレビュー版)、HBv3 シリーズ、および 4 年前のサーバー テクノロジ (HPC 向けに最適化された構成) のパフォーマンスを、さまざまなワークロードと科学領域にわたって比較した結果。
第 4 世代 EPYC CPU を搭載した HBv4/HX シリーズ VM のパフォーマンスの詳細については、こちらの記事を参照してください。
さまざまな HPC ワークロードにわたってパフォーマンスの飛躍的向上をもたらす HBv4 シリーズ
AMD 3D V-Cache™ テクノロジを採用した第 3 世代 AMD EPYC™ プロセッサを搭載する Azure HBv3 VM は、他のクラウドと比べて最大 27 倍高い MPI ワークロードのスケーラビリティ、世界の数多くの主要なスーパーコンピューターを上回る性能、および総コストを削減しながら解決までの時間を短縮するという破壊的変革をもたらす価値提案を特長としており、既に目を見張るレベルの HPC パフォーマンスを実現しています。当然ながら、これにはお客様やパートナー様から大変大きな反応がありました。そしてこのたび、HBv4 シリーズ VM の導入により、Azure はまたしてもその水準を引き上げ、今回はさらに多岐の領域にわたって、メモリ性能や計算能力に依存する超並列ワークロードのパフォーマンス向上をもたらします。
VM サイズ |
物理 CPU |
RAM (GB) |
メモリ帯域幅 (STREAM TRIAD) |
L3 |
FP64 コンピューティング (TFLOPS) |
InfiniBand RDMA |
Standard_HB176rs_v4 |
176 |
688 |
800 |
768 MB |
6 |
400 |
Standard_HB176-144rs_v4 |
144 |
688 |
800 |
768 MB |
6 |
400 |
Standard_HB176-96rs_v4 |
96 |
688 |
800 |
768 MB |
6 |
400 |
Standard_HB176-48rs_v4 |
48 |
688 |
800 |
768 MB |
6 |
400 |
Standard_HB176-24rs_v4 |
24 |
688 |
800 |
768 MB |
6 |
400 |
注: 1) “r” はリモート ダイレクト メモリ アクセス (RDMA) のサポートを表しており、”s” は Premium SSD ディスクのサポートを表しています。2) 一般提供開始時、Azure HBv4 VM は 3D V-Cache を採用した Genoa-X プロセッサにアップグレードされます。その時点で、HBv4 についての更新された技術仕様が掲載される予定です。
次世代のシリコン設計を支える HX シリーズ
Azure では、現在および将来にわたって、シリコン設計に最適なプラットフォームを提供するよう努めています。AMD 3D V-Cache テクノロジを採用した第 3 世代 AMD EPYC プロセッサを搭載する Azure HBv3 VM は、この目標に向けた重要な一歩であり、小規模および中規模のメモリの EDA ワークロード向けに、パブリック クラウドにおいて最高クラスのパフォーマンスと総コスト効率を実現してきました。そしてこのたび、Azure は HX シリーズ VM の導入により、3、4、および 5 ナノメートル プロセスをターゲットとするチップ設計者の間で一般的になりつつある、さらに大規模なモデル専用に構築された VM で差別化を強化します。
HX VM は、以前の H シリーズ VM の 3 倍の RAM、コアあたり最大約 60 GB の RAM 、および制約付きコア VM サイズを特長としています。これにより、シリコン設計のお客様は、コアあたりの商用ライセンスへの投資の ROI を最大化できます。
VM サイズ |
物理 CPU コア数 |
RAM (GB) |
メモリ/コア (GB) |
L3 |
ローカル SSD NVMe (TB) |
InfiniBand RDMA |
Standard_HX176rs |
176 |
1,408 |
8 |
768 |
3.6 TB |
400 |
Standard_HX176-144rs |
144 |
1,408 |
10 |
768 |
3.6 TB |
400 |
Standard_HX176-96rs |
96 |
1,408 |
15 |
768 |
3.6 TB |
400 |
Standard_HX176-48rs |
48 |
1,408 |
29 |
768 |
3.6 TB |
400 |
Standard_HX176-24rs |
24 |
1,408 |
59 |
768 |
3.6 TB |
400 |
注: 1) “r” はリモート ダイレクト メモリ アクセス (RDMA) のサポートを表しており、”s” は Premium SSD ディスクのサポートを表しています。2) 一般提供開始時、Azure HBv4 VM は 3D V-Cache を採用した Genoa-X プロセッサにアップグレードされます。その時点で、HBv4 についての更新された技術仕様が掲載される予定です。
スーパーコンピューティングのお客様向けの 400 ギガビットの InfiniBand
HBv4/HX VM は、Azure で初めて 400 ギガビットの NVIDIA Quantum-2 InfiniBand を活用する仮想マシンです。この最新世代の InfiniBand では、MPI コレクティブ通信のオフロードのサポート、輻輳制御、およびアダプティブ ルーティング機能がさらに強化されています。新しい HBv4/HX シリーズの VM を使用するお客様は、標準の Azure 仮想マシン スケール セット (VMSS) を利用するだけで、CPU ベースの MPI ワークロードをジョブあたり 5 万コアを超えてスケールさせることが可能となります。
Azure HPC のお客様のための継続的改善
マイクロソフトと AMD は、クラウドにおけるハイ パフォーマンス コンピューティングの新時代のビジョンを共有しています。このビジョンは、お客様にとって最も重要な研究ワークロードやビジネス ワークロードに対する継続的改善によって特徴づけられています。Azure は、AMD との連携を継続し、マイクロソフトが提供するパフォーマンス、スケーラビリティ、価値の水準を Azure H シリーズ VM のリリースごとに引き上げることで、このビジョンを実現します。
図 2: 2019 年から 2022 年までの Azure HPC のパフォーマンス。
第 4 世代 EPYC CPU を搭載した HBv4/HX シリーズ VM のパフォーマンスの詳細については、こちらの記事を参照してください。
お客様とパートナー様の声
「嬉しいことに、HBv3 のインスタンスでは Altair® AcuSolve® の素晴らしい線形のスケールアップが見られ、最大 2.5 倍の速度向上が示されました。第 3 世代 AMD EPYC™ プロセッサの 8 ノード (512 コア) 構成を使用すると、パフォーマンスが 12.83 倍向上します。これは、優れた価格性能比を実現していた前世代と比較しても、AcuSolve のスケールアップ値が卓越していることを示しています。当社は、新しい Azure HBv4/HX シリーズ VM の追加を歓迎しており、それらを Altair ソフトウェアと組み合わせて両社共通のお客様にメリットを提供できることを楽しみにしています」 — David Curry 氏、CFD および EDEM 担当シニア バイス プレジデント |
|
「HPC 業界のお客様は、最もミッション クリティカルなデータ集約型のアプリケーションを実行するために、より高いパフォーマンスと最適化を求め続けています。第 4 世代 AMD EPYC プロセッサは、クラウド上の HPC に関して画期的なパフォーマンスを実現し、Azure HX/HBv4 シリーズ VM を採用しているお客様の結果を出すまでの時間を大幅に短縮します」 — Lynn Comp 氏、クラウド ビジネス担当コーポレート バイス プレジデント、AMD |
|
「Ansys のエレクトロニクス分野、半導体分野、流体分野、構造分野のお客様は、製品の複雑さとプロジェクトのスケジュールからもたらされる課題を克服するために、シミュレーション ツールに対してより高いスループットを求めています。3D V-Cache 採用の AMD の第 3 世代 EPYC プロセッサを搭載したマイクロソフトの HBv3 仮想マシンは、価格性能比に優れ、IT オーバーヘッドをほとんど発生させることなく、これらのマルチフィジックス シミュレーションをオンデマンドでサポートしてきました。私たちは、第 4 世代 AMD EPYC プロセッサを搭載した Azure の次世代 HPC VM である HX/HBv4 シリーズを活用して、シミュレーションの複雑さと速度の向上を実現し、リスクを軽減して市場投入の期限に間に合わせることができるようエンジニアを支援できることを楽しみにしています」 — John Lee 氏、エレクトロニクスおよび半導体担当バイス プレジデント兼ゼネラル マネージャー、Ansys |
|
「当社のお客様は、クラウドのパフォーマンスとスケーラビリティを組み合わせることで、革新的な設計の提供を加速させる当社の強力な計算ソフトウェアへの即時アクセスと簡便性を実現してきました。そして、当社はそうした取り組みについて、何千社ものお客様を支援してきました。AMD Genoa プロセッサを搭載した Microsoft Azure の 2 つの新しいハイ パフォーマンス コンピューティング仮想マシンは、ギガスケールの高度なノード設計にまつわる計算能力およびメモリ容量の需要増大に対処しようとする両社共通のお客様に、最適なパフォーマンスを提供できます」 — Mahesh Turaga 氏、クラウド ビジネス開発担当バイス プレジデント、Cadence |
|
「Hexagon のシミュレーション ソフトウェアは、世界で最も高度なエンジニアリングの一部を支えています。当社は、マイクロソフトと提携できることを光栄に感じており、自社ソフトウェアを Azure の新しい HBv4 仮想マシンと組み合わせることができるのをとても嬉しく思っています。Azure HPC チームと共同で実施した早期テストにおいて、HBv3 シリーズ VM と HX シリーズ VM で構造シミュレーションを実施して比較したところ、世代間で 400% のパフォーマンス向上が見られました。当社は、現在および将来、研究や生産性を向上させるために、このソフトウェアとハードウェアの驚くべき組み合わせを利用して、両社共通のお客様がどのようなことを行うのか目にするのを楽しみにしています。2023 年の第 1 四半期には、InfiniBand を介して接続された複数の HBv4 仮想マシンを活用して、重工業分野の CFD 計算のベンチマークを行う予定です」 — Bruce Engelmann 氏、CTO、Hexagon |
|
「Microsoft Azure は、AMD の第 4 世代 EPYC Genoa CPU を搭載した Azure HBv4/HX 仮想マシンの発表により、今回もまたクラウドの HPC インフラストラクチャ プラットフォームの水準を引き上げました。当社は、お客様の HBv4 に対する強い需要を予期しており、クラウドで CFD や EDA などの HPC ワークロードを実行したいと考えているお客様に HBv4 を提供できることを嬉しく思っています」 — Mulyanto Poort 氏、HPC エンジニアリング担当バイス プレジデント、Rescale |
|
「Siemens の EDA ワークロードを使用した AMD による早期テストでは、Microsoft Azure の新しい AMD ベースの仮想マシンで、前世代と比較して実行時間が 15 ~ 22% 短縮されたことが示されました。半導体チップの設計者は、リリース日に間に合わせるのを非常に困難にするさまざまな技術的課題に直面しています。AMD、Microsoft Azure、Siemens のイノベーションを組み合わせることで、最新のオファリングで可能になるパフォーマンス向上を通じて、スケジュールの予測可能性をより簡単に実現できるようになります」 — Craig Johnson 氏、EDA クラウド ソリューション担当バイス プレジデント、Siemens |
|
「チップ開発を目的とするお客様のクラウド採用が加速しています。これは、複雑さと市場投入までの時間における利点によるものです。Synopsys とマイクロソフトの緊密な連携により、EDA と最適化されたコンピューティングが統合され、お客様は Synopsys FlexEDA 従量制モデル下でのスケーリングが可能となります。検証作業は、今日の複雑な SoC 設計における重要な EDA ワークロードを代表するものです。Microsoft Azure で利用可能な AMD の次世代 EPYC プロセッサのリリースにより、お客様は、最適化されたキャッシュと NUMA 対応のメモリ レイアウト技術を利用し、以前の世代と比べて最大 2 倍の検証スループットを実現できるようになります」 — Sandeep Mehndiratta 氏、クラウド担当バイス プレジデント、Synopsys |
詳細はこちらから
- 新しい VM の利用請求を行うためのサインアップ
- 新しい Azure HPC + AI Tech Community のブログ
- HBv4/HX VM のパフォーマンスとスケーラビリティ
- Azure HPC + AI に関する詳細
#AzureHPCAI