【10/27 更新】GeForce RTX 4090ベンチマーク記事を追加いたしました。
GeForce RTX 4090は、GeForce RTX 30シリーズの登場から約2年ぶりにアーキテクチャが刷新されたハイエンドモデルとして、2022年10月12日の22時に販売が開始されました。
今回はこの新たなハイエンドモデルとなるGeForce RTX 4090 について、ベンチマークテストを通してその性能を確認して行きます。
おすすめコスパパソコンに注目!
パソコン工房では、コスパ重視でセレクトしたパーツを搭載したおすすめコスパパソコンを多数ご用意しております。
おすすめコスパパソコンのラインナップは随時追加されますので、お買い逃がしのないようぜひチェックしてください!
更にパソコン工房では、ただいまパソコン工房WEB会員またはビジネスご優待会員の方を対象にBTOパソコンを送料無料でお届けしておりますので、この機会にぜひお買い物をお楽しみください。
GeForce RTX 4090 発売開始!
GeForce RTX 4090 について、パソコン工房での発売を開始いたしました。詳細は特集ページをご覧ください。
パソコン工房で NVIDIA GeForce RTX 4090 特集を見る
Ada Lovelaceアーキテクチャー採用のGeForce RTX 40シリーズについて
Ada Lovelaceアーキテクチャーを搭載する最新のNVIDIA GeForce RTX 40シリーズが発表されました。GeForce RTX 40シリーズは最先端のTSMC 4Nプロセスで製造されており、CUDAコア数は従来のAmpere世代から70%増加、またRTコアが第3世代に進化し、総合でAmpereから2倍以上の性能向上を実現しています。これにより、これまで以上のゲーミング性能・クリエイター性能が期待されます。
主なNVIDIA GeForce RTX 40シリーズの特徴は以下の通りです。
・製造はTSMCの4Nプロセス。760億トランジスタを集積し、CUDAコア数は18,000以上にのぼり、従来のAmpere世代から70%増加
・新しいStreaming Multiprocessorは前世代から2倍以上の性能となる90TFLOPSを達成
・RTコアは第3世代に進化し、Opacity Micromapエンジンにより、ジオメトリのアルファテストにおけるレイトレーシング性能は最大2倍に高速化
・シェーダー実行リオーダリング(SER)により、レイトレーシングにおけるシェーダー処理の効率を向上させ、レイトレーシング性能が最大2~3倍に向上しゲーム全体の性能が25%改善
・Tensorコアは第4世代となり、HPC向けアーキテクチャーのHopperにも搭載されているFP8のTransformerエンジンを搭載し、1.4PFLOPSのTensor性能を達成
GeForce RTX 4090、GeForce RTX 4080 16GBの2モデルが登場予定
9月20日(日本時間9月21日)の発表では、GeForce RTX 4090、GeForce RTX 4080 16GB・12GBの3製品が公開され、10月14日(日本時間10月15日)に12GBがキャンセルされました。ここでは、現時点で判明している、GeForce RTX 40シリーズなどのスペックをまとめました。
※メーカー等による事前情報です。最終スペックと異なる場合があります。
GeForce RTX 4090 |
GeForce RTX 4080 |
GeForce RTX 3090 Ti |
|
---|---|---|---|
NVIDIA CUDAコア |
16384 | 9728 | 10752 |
Shaderコア | Ada Lovelace 83 TFLOPS |
Ada Lovelace 49 TFLOPS |
Ampere 40 TFLOPS |
レイ トレーシング コア |
第3世代 191 TFLOPS |
第3世代 113 TFLOPS |
第2世代 78 TFLOPS |
Tensor コア(AI) |
第4世代 1321 AI TOPS |
第4世代 780 AI TOPS |
第3世代 320 AI TOPS |
定格 クロック |
2.23GHz | 2.21GHz | 1.56GHz |
ブースト クロック |
2.52GHz | 2.51GHz | 1.86GHz |
VRAM | 24GB GDDR6X |
16GB GDDR6X |
24GB GDDR6X |
メモリ 転送レート |
21Gbps | 22.4Gbps | 21Gbps |
メモリ インター フェイス幅 |
384ビット | 256ビット | 384ビット |
メモリバス 帯域幅 |
1008GB/s | 716.8GB/s | 1008GB/s |
TGP | 450W | 320W | 450W |
GeForce RTX 4090ベンチマーク情報
それでは、GeForce RTX 40シリーズの最上位モデルGeForce RTX 4090 のベンチマークを実行していきましょう。比較対象としては、GeForce RTX 30シリーズからGeForce RTX 3090 Ti、Radeon RX 6000シリーズからRadeon RX 6950 XTを用意しました。テスト解像度はWQHD(2560 x 1440)、4K(3840 x 2160) の解像度にて行っています。また、3D Markでは、CPU性能の依存度が少ないGraphics Scoreでの比較となります。
GeForce RTX 4090 |
GeForce RTX 3090 Ti |
Radeon RX 6950 XT |
|
---|---|---|---|
アーキテクチャ | Ada Lovelace | Ampere | RDNA 2 |
GPUコア | AD102 | GA102 | Navi 21 |
製造プロセス | 4nm | 8nm | 7nm |
CUDAコア | 16384基 | 10752基 | 5120基 |
RTコア (Ray Accelerators) | 第3世代 128基 |
第2世代 84基 |
80基 |
Tensorコア | 第4世代 512基 |
第3世代 336基 |
– |
定格クロック | 2.23GHz | 1.67GHz | 未公開 |
ブーストクロック | 2.52GHz | 1.86GHz | 2310MHz |
メモリタイプ | GDDR6X | GDDR6 | |
メモリ容量 | 24GB | 16GB | |
メモリ転送レート | 21Gbps | 18Gbps | |
メモリバス幅 | 384bit | 256bit | |
TDP(TBP) | 450W | 335W | |
補助電源 | 12VHPWR ×1 or 8Pin×3(変換) | 8Pin×2 | |
推奨電源 | 850W | 850W |
※メーカーによる事前情報です。実際の製品では変更になる場合があります。
GeForce RTX 4090は、おおざっぱに言えばGeForce RTX 3090 Tiと電源周りやモリ転送レートなどの足回りの仕様は流用しつつ、プロセスルールの縮小によりCUDAコア数を大幅に強化したモデルと言えます。また、動作クロックについてもRadeon RX 6950 XTを上回っており、GPUコア数と動作クロックの両面において新しいハイエンドモデルに相応しい内容となっています。
なお、過去のデータと比較のためResizable BARについては無効としてベンチマークテストを行っております。
※ベンチマークテストで用いた構成は末尾に記載しています
3DMark 「Fire Strike」
まずは、DirectX 11 の代表的ベンチマークとして、3DMark 「Fire Strike」 のGraphics Score を見てみましょう。テスト解像度は、WQHD のFire Strike Extremeと4KのFire Strike Ultraとなります。
GeForce RTX 4090が圧倒的なスコアを記録しており、GeForce RTX 3090 Tiからは70%ほど、Radeon RX 6950 XTに対してもおおよそ50%程度スコアが向上しています。解像度が上がるほど性能差が広がっており、GeForce RTX 4090の処理性能には余裕が有る事が感じられます。
3DMark 「Time Spy」
次いで、DirectX 12の代表的ベンチマークとして、3DMark 「Time Spy」 のGraphics Scoreを見てみましょう。テスト解像度は、WQHDのTime Spyと4KのTime Spy Extremeとなります。
Time SpyでもGeForce RTX 4090が両者を圧倒しました。GeForce RTX 3090 Ti、Radeon RX 6950 XTから60%以上スコアが向上しており、Fire Strikeと同様に解像度が上がるほど性能差が広がっています。
3DMark 「Port Royal」
続いて、リアルタイムレイトレーシング性能を見るベンチマークテストの3DMark「Port Royal」を用いて、レイトレーシング性能を見ていきましょう。Port Royalでは、いくつかあるレイトレーシングアルゴリズムのうち、レイトレーシングリフレクションを使用したものとなります。
ベンチマークスコアであるGraphics Scoreと一緒にフレームレートも計測することが出来ます。なお、解像度は標準設定のWQHDとなります。また、DLSSについては無効となっており、RTコアの性能の比較として見ていきます。
Port RoyalでもGeForce RTX 4090はGeForce RTX 3090 Tiから70%以上も向上しています。フレームレートも100fpsを優に上回っており、レイトレーシングの世界においても高リフレッシュレートのモニターが必要になりそうです。
ではリアルタイムレイトレーシングにDLSSを有効にするとどうなるのかを続けてみていきます。
3DMark 「NVIDIA DLSS feature test」
Port Royal に続いて、「NVIDIA DLSS feature test」を確認してみましょう。「NVIDIA DLSS feature test」は、レイトレーシング性能を見る「Port Royal」を活用したベンチマークテストで、GeForce RTX 40シリーズやGeForce RTX 30シリーズが搭載するTensorコアを用いたDLSS(Deep Learning Super Sampling)の性能を見ることが出来、結果はフレームレートで表示されます。今回はテスト解像度にWQHDと4Kを、DLSSモードはPerformanceとQualityを選択しています。なお、DLSSが有効ではない場合の結果はOFF として計測されます。また、Radeon RX 6950 XTはDLSSに非対応のため除外しています。なお、GeForce RTX 4090はDLSS3に対応しますが、ベンチマーク計測時点の3DMarkではDLSS2までの対応であったため、本結果はDLSS2による比較となります。
DLSSの効果においても、GeForce RTX 4090はGeForce RTX 3090 Tiに対しておおよそ70%のスコア向上となっています。レイトレーシング性能もGeForce RTX 30 シリーズから大きく向上していることが確認出来ます。
さて、GeForce RTX 4090は4K解像度でもまだまだ余力が有りそうなので、8K解像度でもベンチマークを実施してみました。8K解像度では、DLSSモードにUltra Performanceが追加されるため、PerformanceとQuality に加えてUltra Performanceの結果も掲載します。
Ultra Performanceモードながら、GeForce RTX 4090 は8K解像度において60fpsを上回る性能を見せてくれました。GeForce RTX 4090ならば、8K解像度での快適なゲーミングというのも夢物語ではなくなるかもしれません。
3DMark 「DirectX Raytracing feature test」
3DMarkを用いたベンチマークの最後に、「DirectX Raytracing feature test」を見てみましょう。本テストはすべての画面をレイトレーシングでレンダリングすることで、より負荷の高いグラフィックスカードのレイトレーシング性能を計測できます。結果はフレームレートで表示されます。なお、Sample count 数は、標準設定の12のほか、6と20を加えてテストを行いました。
GeForce RTX 4090とGeForce RTX 3090 Tiとの差がNVIDIA DLSS feature testよりも大きくなり、おおよそ120%の向上(おおよそ2.2倍)となっています。SERなどの新たに追加されたレイトレーシングの演算の効率化の効果の高さが見て取れます。GeForce RTX 30シリーズの第2世代RTコアからGeForce RTX 40シリーズの第3世代RTコア搭載へと、着実に進化を続けていることが確認出来ます。
3DMark 「Speed Way」
最後の最後に、ベンチマークテスト中に3DMarkが更新され、「Speed Way」という新しいベンチマークが追加されたので、折角なので試してみました。Speed WayはDirectX 12 Ultimateに対応したベンチマークテストで、DirectX レイトレーシングやメッシュシェーダーを使用して、リアルタイムにグローバルイルミネーションやレイトレーシングによる反射の描画を行い、その性能をテストする内容となっています。
Speed Wayにおいても、Port Royalと同じくベンチマークスコアであるGraphics Scoreと一緒にフレームレートも計測することが出来、標準設定の解像度はWQHDとなります。また、DLSSについては無効となっており、RTコアの性能の比較として見ていきます。
初めてのベンチマークのため全く予備知識は無いのですが、パッと見でスコアの差は有るもののPort Royalとほとんど変わらない結果となっていることから、レイトレーシングの性能が色濃く反映されているのかもしれません。また、フレームレートを100倍するとほぼGraphics Scoreとなるという分かりやすいスコアとなっていました。
FINAL FANTASY XV WINDOWS EDITION ベンチマーク
続いて、FINAL FANTASY XV WINDOWS EDITION ベンチマークです。テスト環境設定は高品質・フルスクリーンで、テスト解像度はWQHDと4Kになります。なお過去のデータと比較のためSDRかつ、DLSSは無効としています。
WQHD解像度ではおおよそ50%、4K解像度ではおおよそ80%のスコア向上となっており、3DMarkと同様に解像度が上がるほど、差を広げる格好となっています。
そして、とうとうGeForce RTX 4090は4K解像度でも「非常に快適」な動作の指標(12000~)を楽々とクリアしてしまいました。GeForce RTX 4090なら4K解像度での快適なゲーミングも余裕でこなしてくれそうです。
ファイナルファンタジーXIV: 暁月のフィナーレ ベンチマーク
最後に、ファイナルファンタジーXIV: 暁月のフィナーレ ベンチマークです。テスト環境設定は最高品質・DirectX 11・フルスクリーン、テスト解像度はWQHDと4Kとなります。ファイナルファンタジーXIV: 暁月のフィナーレについては、ベンチマークテストの詳細で平均fps(フレームレート)も確認できるので、合わせて掲示します。
ファイナルファンタジーXIV: 暁月のフィナーレ においては、GeForce RTX 3090 Tiと比べてWQHD解像度でおおよそ20%、4K解像度でもおおよそ35%と、今までのベンチマークの結果と比べると差が小さくなっています。グラフには掲載していませんがフルHD解像度では僅か2%のスコア差となっており、ファイナルファンタジーXIV:暁月のフィナーレ ではCPU性能の方が頭打ちとなってしまっているようです。
動作の指標においては4K解像度で「非常に快適」な動作の指標(15000~)を軽々と上回っており、フレームレートもWQHD解像度で260fps以上、4K解像度で185fps以上と、抜群の性能を示しています。
CPUの設定変更でフルHD時のスコア改善
最後にちょっとした余談を。これはGeForce RTX 4090の動作テスト中に遭遇した現象で、3DMarkのFire Strikeを動作させていた時に確認出来た内容となります。それは、Core i9-13900K + GeForce RTX 4090 という超ハイエンド環境にもかかわらず、ベンチマークスコアが振るわない、という症状に出くわしました。これがそのベンチマーク結果の画面です。
十分に高いスコアではありますが、何回測定しなおしても結果は変わりませんでした。Fire StrikeのフルHDではGeForce RTX 4090にとっては負荷が軽すぎて、CPUがボトルネックとなってしまった結果となります。原因を探るべくいろいろと設定をいじっていたところ、E-coreの数を「0」に(E-coreを無効に)した状態でFire Strikeを実行したところ、結果が変化しました。その結果がこれです
ご覧の通り、Graphics scoreが61270 → 86094へと爆上がりし、トータルスコアも45153 → 50599に大きく上昇しています。もちろんE-coreを無効化しているため減少したコア数が影響し、CPUスコア(Physics score)は49047 → 40003へと下がります。先述のとおり、CPUがボトルネックとなっており、特にCore i9-13900KのE-coreが足を引っ張っているようでした。Core i9-13900K + GeForce RTX 4090という超ハイエンドな環境でフルHD解像度動作をさせる事はあまり無いかも知れませんが、思ったようにベンチマークスコアが出ない、ゲーミング環境が思ったほど快適にならない、というような症状に出会った場合には、第13世代インテルCoreプロセッサーや第12世代インテルCoreプロセッサーであれば効果が見込めるかもしれません。
なお、動作テストで使用したASUS PRIME Z690-Pでは、以下の様にUEFI BIOSの設定を変更する事でE-coreを無効化することが出来ます。
※UEFI BIOSの設定はマザーボードごとに異なりますので、マザーボードに合わせて設定をお願いします
1.DELキー または F2キー を押してUEFI BIOS Utility設定画面に移動します
2.F7キーを押してUEFI BIOS Utility -EZ ModeをAdvanced Modeに切り替えます
3.メニュー上部のAdvancedタブからCPU Configuration を選択します
4.CPU Configuration 内のActive Efficient Cores の設定を「0」にする
5.メニュー上部のExitタブからSave Changes&Reset を選択して、設定内容を保存し再起動します
6.OS上で認識されているCPUの数が変化しています(Core i9-13900Kなら8コア16スレッドに変化)
新世代ハイエンドGPUの性能を示したGeForce RTX 4090
GeForce RTX 4090は、GeForce RTX 30シリーズの最上位モデルであるGeForce RTX 3090 TiやRadeon RX 6000シリーズの最上位モデルであるRadeon RX 6950 XTに対して段違いの性能を見せており、ほとんどのベンチマークにおいて50%以上スコアが向上しています。解像度が高くなるほどスコアの差が広がる傾向を示しており、FINAL FANTASY XV WINDOWS EDITION ベンチマークにおいては4K解像度で非常に快適の指標を軽く上回るなど、4K解像度でも余裕の性能を示しており、4Kでのゲーミング性能に力不足を感じているゲーマーは乗り換えを検討してはどうでしょうか。
GeForce RTX 4090は、DLSS3による性能向上も期待でき、AIによるフレームの生成なども含め、リアルタイムレイトレーシングかつ、4Kかつ高フレームレートを実現する、現在入手可能な最高峰クラスのグラフィックスカードと言っていいでしょう。
GeForce RTX 4090の販売価格は現在のところ30万円前後と高額なグラフィクスカードですが、世代交代するに相応しいだけの性能を存分に見せてくれました。4K解像度でも余裕でこなすGeForce RTX 4090は、4K以上の高解像度での優れたゲーミングパフォーマンスを必要としているユーザーには、手にして間違いのない選択肢となるでしょう。
グラフィックスカード | ZOTAC製 GeForce RTX 4090 (※ブースト:2535MHz) |
MSI製 GeForce RTX 3090 Ti (※ブースト:1920MHz) |
MSI製 Radeon RX 6950 XT (※ゲーム:2244MHz /ブースト:2454MHz) |
---|---|---|---|
CPU | Core i9-13900K (P-core:8コア、E-core:16コア / 32スレッド) | ||
CPUクーラー | Inwin製360mm水冷クーラー (IW-LC-BR36) | ||
マザーボード | ASUS Prime Z690-P | ||
メインメモリ | DDR5-4800 32GB (16GB x2) | ||
ストレージ | Samsung 980 PRO 1TB (MZ-V8P1T0B) PCIe4.0x4 M.2 NVMe SSD | ||
電源 | Seasonic SSR-1000PD (80PLUS Platinum、1000W) | ||
OS | Windows 11Home 64bit (バージョン:22H2) | ||
グラフィックス ドライバ | GeForce Game Ready Driver Ver 522.25 | AMD Software: Adrenalin Edition 22.5.1 |
Windows2000登場前からほぼ一貫してPC製造部門に従事。PC組立はもちろん、OSイメージの作成や製造時のトラブルシュートを行う。 その経験を生かしてOSの基本情報や資料室を担当する事が多い。