Nvidiaは10月5日(現地時間)、GTC 2020オンライン・カンファレンスで、新しいAmpereアーキテクチャを採用したプロフェッショナルGPU、RTX A6000とRTX A40を発表しました。
今回からQuadroブランドがなくなっていますが、これは、TuringベースのQuadro RTX 6000やQuadro RTX 8000の後継となります。
NVIDIA RTX A6000とNVIDIA A40について
RTX A6000とA40のスペックは、演算能力とDisplayPort出力端子数が少し異なること以外はほぼ同一仕様となります。また大きな違いとしては、RTX A6000はワークステーションへの組み込みを想定し自ら冷却ファンを備えていますが、A40は冷房のある場所(サーバ)への設置を前提にされており、ヒートシンクのみとなっています。
RTX A40のイメージ
NVIDIA RTX A6000とNVIDIA A40は、以下のようなパフォーマンスを提供します。
- 第2世代のRTコア:前世代に比べて 2 倍のスループットと、シェーディングやノイズ除去機能と共にレイ トレーシングを並行して実行する能力を備えた第 2 世代 RT コアにより、動画コンテンツの写真のようにリアルなレンダリング、建築デザインの評価、製品デザインの仮想プロトタイプなどのワークロードのための大幅な高速化を実現します。このテクノロジは、より優れた視覚的正確さでより速い結果をもたらすためのレイ トレーシングによるモーション ブラーのレンダリングも高速化します。
- 第3世代のTensorコア:新しい Tensor Float 32 (TF32) 演算により、前世代に比べて 5 倍のトレーニング スループットを提供するため、コードを変更する必要なく、AI およびデータ サイエンスのモデル トレーニングを高速化します。構造化スパース性に対応するハードウェアにより、推論スループットを 2 倍にします。 Tensor コアはまた、DLSS、AI ノイズ除去、特定のアプリケーション向けの拡張編集などの機能を備えたグラフィックスにも AI をもたらします。
- 新しいCUDAコア:前世代のFP32の最大2倍のスループットを提供し、グラフィックスと計算を大幅に向上させます。単精度浮動小数点 (FP32) 演算の倍速処理および改善された電力効率により、デスクトップで複雑な 3D のコンピューター支援設計 (CAD) とコンピューター支援エンジニアリング (CAE) などのグラフィックスやシミュレーションのワークフローに適したパフォーマンス向上を実現します。
- 48GBのGPUメモリ:1つのGPUで利用可能な最大のメモリで、NVLinkを使用して2つのGPUを接続することで96GBまで拡張可能。データ サイエンティスト、エンジニア、クリエイティブなプロフェッショナル向けに、データ サイエンスやシミュレーションなどの膨大なデータセットやワークロードを使用する作業に必要な大容量メモリを提供します。
- 仮想化対応:NVIDIA Virtual WorkstationのようなNVIDIA仮想GPUソフトウェアを追加することで、リモートユーザーのためにグラフィックワークロードや強力な仮想ワークステーションインスタンスをスケールでサポートし、ハイエンドのデザイン、AI、計算ワークロードのための大規模なワークフローを可能にします。
- PCIe Gen 4:PCI Express Gen 4 対応により、PCIe Gen 3 の 2 倍の帯域幅を提供することで、AI やデータサイエンスなどのデータ集約型タスク向けに CPU メモリからのデータ転送速度が向上します。
パフォーマンス比較
RTX A6000 | Quadro RTX 8000 | Quadro RTX 6000 | |
---|---|---|---|
アーキテクチャ | Ampere | Turing | Turing |
CUDAコア | 10752 | 4608 | 4608 |
Tensorコア | 656 | 576 | 576 |
RTコア | 84 | 72 | 72 |
浮動小数点演算性能(単精度) | 40TFLOPS | 16.3TFLOPS | 16.3TFLOPS |
メモリ | 48 GB GDDR6(ECC) | 48GB GDDR6 | 24GB GDDR6 |
メモリバス幅 | 384-bit | 384-bit | 384-bit |
メモリ帯域 | 768 GB/s | 672 GB/s | 672 GB/s |
TDP | 300W | 295W | 295W |
補助電源ピン | CPU 8ピン×1 | PCIe 8ピン×1、6ピン×1 | PCIe 8ピン×1、6ピン×1 |
ソフトウェアパートナーの初期テストとコメント
Blackmagic、Chaos Group、Luxionなどのソフトウェアパートナーによる初期テストでは、ユーザーがこれらの新しいGPUで体験するパフォーマンスの向上が示されています。
Blackmagic Design
Blackmagic Designの社長Dan May氏は次のように述べています。
「私たちは、NVIDIA RTX A6000で測定したパフォーマンスが、一般的なグレーディング機能と私たちの最近のAIベースのツールの両方で、前世代のGPUと比較して著しく優れていることに感銘を受けました。その48ギガバイトのメインメモリは、Blackmagic RAW 8Kと12Kカメラのワークフローを大幅に強化し、編集とグレーディングのパフォーマンスを流動的なものにしてくれます」
Chaos Group
Chaos Groupの製品管理担当副社長の Phillip Miller 氏は次のように述べています。
「NVIDIA Ampereは、RTX 3080とRTX 2080を比較すると、V-Ray GPUとProject Lavinaの性能が2倍以上になり、当社のすべてのGPUレイトレーシングに恩恵を与えてくれます。我々のユーザーは、1枚のカードでHD解像度で100%のレイトレーシングをリアルタイムで行うことができるようになりました。」
Luxion
人気のあるKeyShot製品ビジュアライゼーションツールのメーカーであるLuxionは、NVIDIA Ampereアーキテクチャを使用して、3倍近いパフォーマンスを実現しています。無料のKeyShot Viewerの統合ベンチマークでは、NVIDIA RTX 6000で34.7、NVIDIA RTX A6000で88.8という結果が出ています。今後リリースされるKeyShot 10では、A6000の性能は95.6とさらに向上しており、A6000はCPUベースラインの95.6倍の速さを実現しています。
価格と発売日
NVIDIA RTX A6000は、12月中旬からPNY、Leadtek、Ingram Micro、Ryoyoなどのチャネルパートナーとnvidia.comから購入可能に、NVIDIA A40は、来年初めから世界中のOEMワークステーションとサーバーのベンダーから初めて入手可能になる予定です。
価格は発表されていません。
コメント