IntelのAI向けアクセラレーター「Gaudi 2」はNVIDIA H100より55%も高速? Stable Diffusion 3で
マイナビニュース2024年3月12日(火)17時4分
生成AIを開発するStability AIは3月11日(現地時間)、開発中でもうすぐ初期プレビュー版をリリース予定の「Stable Diffusion 3」を用いて、AI向けアクセラレーターのベンチマークテストの結果について公開した。Intel製品がNVIDIA製を圧倒している……という内容だが、NVIDIAが最近公開した最適化で逆転される例もあるようだ。
Stability AIはStable Diffusionシリーズを開発している組織で、現在最新バージョンとなる「Stable Diffusion 3」を開発中。これに際して強力な計算資源が必要だったとしており、Intel Gaudi 2アクセラレーターを選択。「リードタイムが最大1年に及ぶシリコンプロバイダーと異なり……」と他社について言及しつつ、Intelは最先端のGaudi 2をすぐに提供可能だったことや、競合より16GBも多い96GB HBM2eメモリを採用していたことで大規模なモデルの実行に向いていたという。
そこで、Stability AIはIntel Gaudi 2とNVIDIA A100、NVIDIA H100を用いてトレーニング速度を比較。2つのノードで合計16個のアクセラレータをそれぞれ用い、2Bマルチモーダル拡散トランス(MMDiT) のトレーニングスループットを計測した。
Intel Gaudi 2は1秒当たり927枚もの画像処理を行い、NVIDIA H100 80GBよりも1.5倍高速だった。さらに、NVIDIA H100よりも大規模なHBM2eメモリを搭載していることから同時処理するバッチ数を32に設定することも可能で、この場合は1,254枚の画像処理が行えたという。
ただし、NVIDIAはTensorRTを活用したLLMトレーニング向けに強力な最適化を継続しており、ライブラリによってはNVIDIAのほうが速い場合もあるという。例えば、PyTorchを使用したStable Diffusion XLモデルにおけるテスト(30ステップ、1.024×1,024ドット画像の生成)において、Intel Gaudi 2では3.2秒で生成可能。NVIDIA A100(PyTorch)では3.6秒だったが、NVIDIA A100(TensorRT)では2.7秒しかかからなかったと言及している。
Stability AIはStable Diffusionシリーズを開発している組織で、現在最新バージョンとなる「Stable Diffusion 3」を開発中。これに際して強力な計算資源が必要だったとしており、Intel Gaudi 2アクセラレーターを選択。「リードタイムが最大1年に及ぶシリコンプロバイダーと異なり……」と他社について言及しつつ、Intelは最先端のGaudi 2をすぐに提供可能だったことや、競合より16GBも多い96GB HBM2eメモリを採用していたことで大規模なモデルの実行に向いていたという。
そこで、Stability AIはIntel Gaudi 2とNVIDIA A100、NVIDIA H100を用いてトレーニング速度を比較。2つのノードで合計16個のアクセラレータをそれぞれ用い、2Bマルチモーダル拡散トランス(MMDiT) のトレーニングスループットを計測した。
Intel Gaudi 2は1秒当たり927枚もの画像処理を行い、NVIDIA H100 80GBよりも1.5倍高速だった。さらに、NVIDIA H100よりも大規模なHBM2eメモリを搭載していることから同時処理するバッチ数を32に設定することも可能で、この場合は1,254枚の画像処理が行えたという。
ただし、NVIDIAはTensorRTを活用したLLMトレーニング向けに強力な最適化を継続しており、ライブラリによってはNVIDIAのほうが速い場合もあるという。例えば、PyTorchを使用したStable Diffusion XLモデルにおけるテスト(30ステップ、1.024×1,024ドット画像の生成)において、Intel Gaudi 2では3.2秒で生成可能。NVIDIA A100(PyTorch)では3.6秒だったが、NVIDIA A100(TensorRT)では2.7秒しかかからなかったと言及している。
「Intel」をもっと詳しく
- 「NVIDIA GeForce GTX 1080 Ti」発売7周年。性能的には現役、でもDirectX12 Ultimate要求ゲームはつらい
- Webkit・Chromium・Geckoが協力開発した「Speedometer 3.0」登場 - 体感しやすい速度指標のブラウザベンチ
- MSI、低電圧に設定してもCPU性能が下がらないBIOSアップデート公開 - Intel CEP機能を無効化する
- GeForce GTX 10シリーズでは厳しかった『Alan Wake 2』が最適化 - DirectX12 Ultimateに対応できない旧GPU向け
- Linux用VulkanドライバにCPUベースのレイトレーシング機能が新搭載。開発者「性能については聞かないで」
「Intel」のニュース
-
MSI、Z790シリーズマザーボードにて、Intel製CPUのゲームクライアントクラッシュ問題に対処する最新BIOSを発表5月16日12時46分
-
2台のPCを“直結”して高速データ転送と画面共有を実現——Intelが「Thunderbolt Share」を発表 対応製品は2024年後半に登場予定5月16日6時0分
-
今週の秋葉原情報 - マザーボードや電源やケースなど、各社から白いモデルが一挙に新発売5月15日17時4分
-
【Amazon得報】AcerのGF RTX 4050搭載ゲーミングノートが10%オフの134,820円!5月14日15時51分
-
Intel「Aurora」スーパーコンピューターが“エクサスケール”突入 - 運用容量は87%まで上昇5月14日14時1分
-
Oracle Fusion Data Intelligenceに新たなAI機能、ERPやSCMの分析強化5月14日10時57分
-
“Intel Default Settings”とは一体、PL1125W・PL2188Wと仮定して第14世代Core i9に適用してみた5月14日7時0分
-
Intel ArcにARCTIC水冷キットにマウスに! 白と黒が選べる新製品が多数登場5月13日18時0分
-
IntelのCPU狙う新しいサイバー攻撃「Pathfinder」が発見5月13日9時51分
-
吉川明日論の半導体放談 第301回 AMDとIntelの決算発表から見えるもの、「PC/サーバセントリック」から「AIセントリック」へ5月13日6時35分