ナナキュッパから買える新型GPU「GeForce RTX 5060 Ti(16GB)」を試して分かったこと モンスターハンターワイルズもフルHD/WQHDなら快適そう
2025年4月16日(水)22時5分 ITmedia PC USER
今回レビューするGainward製グラフィックスカード「GeForce RTX 5060 Ti Python III 16GB」のパッケージ
GeForce RTX 5060 Tiは、フルHD(1920×1080ピクセル)〜WQHD(2560×1440ピクセル)をターゲットとする「GeForce RTX 5060ファミリー」における上位モデルという位置付けで、グラフィックスメモリが8GBか16GBから選択できる。ただし、NVIDIA純正のグラフィックスカード「Founders Edition」は用意されない。
今回、NVIDIAから先行レビュー用にGainward(ゲインワード)製グラフィックスカード「GeForce RTX 5060 Ti Python III 16GB」(定格仕様の16GBモデル)を借用した。GeForce RTX 5060 Ti(16GB)の実力はいかほどのものか、チェックしていこう。
●GeForce RTX 5060 Tiの概要
GeForce RTX 5060 Tiには、グラフィックスメモリの容量が「8GB」の構成と「16GB」の構成がある。今回は純粋にグラフィックスメモリの容量が異なるだけで、SoC(System On a Chip)はどちらのモデルも「GB206」を採用している。主な仕様は以下の通りだ。
・CUDAコア:4608基
・Tensorコア(ピーク処理性能):759 AI TOPS
・RTコア(ピーク処理性能):72TFLOPS
・動作クロック:2.407GHz〜2.572GHz
・グラフィックスメモリ:8GBまたは16GB(GDDR7/128bit)
・動画エンコーダー:1基(第9世代)
・動画デコーダー:1基(第6世代)
・接続バス:PCI Express 5.0 x8(PCI Express 4.0互換)
・消費電力:180W(推奨電源容量:600W)
先代の「GeForce RTX 4060 Ti」と比べると、CUDAコアは256基削減されている。しかし世代交代のおかげもあってか、ピーク演算性能はシェーダーがほぼ据え置き(22TFLOPS→24TFLOPS)、Tensorコアが約2.15倍(353TOPS→759TOPS)、RTコアが約1.4倍(51TFLOPS→72TOPS)に引き上げられている。最大消費電力は15〜20W多くなった。
筆者の勝手な印象だが、5060 Tiは「強化されたDLSS(Deep Learning Super Sampling)による超解像とマルチフレーム生成でパフォーマンスアップを狙ったGPU」といったところだろうか。
なお、GeForce RTX 5060 Tiを含むGeForce RTX 5060ファミリーは、今までのGeForce RTX 50シリーズと異なりPCI Expressバスが8レーンとなっている。理論的にPCとの通信速度は半分なので、描画解像度が高いと(≒データ転送量が多くなると)ボトルネックになりうる。
●GeForce RTX 5060 Ti Python III 16GBの特徴
先述の通り、GeForce RTX 5060 TiにはNVIDIA純正のFounders Editionは存在しない。全てのグラフィックスカードがパートナー企業を通して販売される。
今回レビューするGeForce RTX 5060 Ti Python III 16GBは、Gainwardのゲーミンググラフィックスカード「Python(パイソン)」ブランドの製品で、NVIDIAの定格仕様で動作する。
本製品はNVIDIAの定める「SFF(スモールフォームファクター)要件」を満たしており、コンパクトなPCケースにも収めやすい3連ファン製品であることをウリとしている。具体的なサイズは約117(幅)×292(奥行き)×42(厚さ)mmで、2スロット厚ピッタリに収まっている上、ブラケットからのはみ出しもほぼない。
映像出力端子は、標準仕様の通りHDMI 2.1b×1とDisplayPort 2.1b×3を備える。GPU補助電源ピンは、何と旧規格の「8ピン×1」構成となっている。NVIDIA自身は新規格の「16ピン(12V2x6)」を積極的に採用しているところ、古いグラフィックスカードからの置き換えも狙ってか、本製品については旧規格を採用したものと思われる。
●GeForce RTX 5060 Ti(16GB)の実力をチェック!
今回、GeForce RTX 5060 Ti Python III 16GBの実力をチェックするのに使うのは、Intel(当時)が2022年末に発売した「Intel NUC 13 Extreme Kit」のCore i9-13900Kモデルだ。主なスペックは以下の通りだ。
・CPU:Core i9-13900K
・Pコア:8基16スレッド(3GHz〜5.8GHz)
・Eコア:16基16スレッド(2.2GHz〜4.3GHz)
メモリ:DDR5-5600 32GB SO-DIMM×2(Kingstone製)
ストレージ:1TB SSD(1000G Kingston FURY Renegade PCIe 4.0 NVMe M.2 SSD)
OS:Windows 11 Pro バージョン24H2
今回は、比較対象として以下のグラフィックスカードも用意し、並行してベンチマークテストを実施した。
・GeForce RTX 5070 Founders Edition(NVIDIA純正)
・GeForce RTX 4070 Founders Edition(NVIDIA純正)
・GeForce RTX 4060 Ventus 2X BLACK 8G OC(MSI製)
GeForce RTX 4060を搭載するGeForce RTX 4060 Ventus 2X BLACK 8G OCのみ定格よりも最大クロックが高い「オーバークロック」仕様で、残りはNVIDIAの定格仕様で動作する。グラフィックスドライバは、全て「バージョン575.94(β版)」でそろえて計測をしている。そのためGeForce RTX 5070/4070 Founders Editionについては、以前のテストと比べてスコアが異なる可能性がある。
3DMark
ULの3Dグラフィックスベンチマークテストアプリ「3DMark」では、DirectX 11/12 APIを利用する主要なテストを実行した。総合スコアは以下の通りだ。
・GeForce RTX 5060 Ti(16GB)
・Time Fire Strike(フルHD/DirectX 11):3万4968ポイント
・Time Fire Strike Extreme(WQHD/DirectX 11):1万9408ポイント
・Time Fire Strike Ultra(4K/DirectX 11):9588ポイント
・Time Spy(WQHD/DirectX 12):1万6180ポイント
・Time Spy Extreme(4K/DirectX 12):7705ポイント
・Port Royal(4K/DirectX Raytracing):9941ポイント
・Speed Way(4K/DirectX 12 Ultimate):4072
GeForce RTX 5070
・Time Fire Strike(フルHD/DirectX 11):4万1238ポイント
・Time Fire Strike Extreme(WQHD/DirectX 11):2万7627ポイント
・Time Fire Strike Ultra(4K/DirectX 11):1万4613ポイント
・Time Spy(WQHD/DirectX 12):2万1765ポイント
・Time Spy Extreme(4K/DirectX 12):1万707ポイント
・Port Royal(4K/DirectX Raytracing):1万4064ポイント
・Speed Way(4K/DirectX 12 Ultimate):5841ポイント
GeForce RTX 4070
・Time Fire Strike(フルHD/DirectX 11):3万6555ポイント
・Time Fire Strike Extreme(WQHD/DirectX 11):2万534ポイント
・Time Fire Strike Ultra(4K/DirectX 11):1万172ポイント
・Time Spy(WQHD/DirectX 12):1万8130ポイント
・Time Spy Extreme(4K/DirectX 12):8813ポイント
・Port Royal(4K/DirectX Raytracing):1万1292ポイント
・Speed Way(4K/DirectX 12 Ultimate):4552ポイント
GeForce RTX 4060
・Time Fire Strike(フルHD/DirectX 11):2万6426ポイント
・Time Fire Strike Extreme(WQHD/DirectX 11):1万2390ポイント
・Time Fire Strike Ultra(4K/DirectX 11):5900ポイント
・Time Spy(WQHD/DirectX 12):1万1239ポイント
・Time Spy Extreme(4K/DirectX 12):5390ポイント
・Port Royal(4K/DirectX Raytracing):6045ポイント
・Speed Way(4K/DirectX 12 Ultimate):2658ポイント
同一アーキテクチャの5070と比較してみると、一応「5070の下に5060 Tiがある」ということで「性能にあまり差はないだろう」と思っている人がいるかもしれない。しかし、実際はスコアベースで15〜30%程度の性能差が生じる。これは各種コアの数とPCI Expressバスの幅(レーン数)の差に起因すると思われる。
一方で旧アーキテクチャの4060/4070と比較してみた場合、スコアベースでは4070比では5〜13%程度性能が低い一方で、4060比では1.3〜1.6倍の高性能ということになる。今回はPCI Express 5.0バスを備えるPCでテストしていることもあってか、旧世代における1ランク上のGPUと案外いい勝負を演じつつ、1ランク下のGPUには圧勝という結果だ。
FF14ベンチマーク
続けて、スクウェア・エニックスの「ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク(FF14ベンチマーク)」を試してみよう。
本ゲームの場合、解像度プリセットはHD(1280×720ピクセル)/フルHD/4Kの3種類だが、今回はフルHD/4Kと、カスタム解像度としてWQHDを「最高画質」のフルスクリーン表示でテストした。本プログラムではDLSSを利用できるが、今回は「60fpsを下回る場合に有効」(標準設定の通り)としている。結果は以下の通りだ。
・GeForce RTX 5060 Ti
・フルHD:2万1672ポイント
・WQHD(カスタム解像度):1万4558ポイント
・4K:1万456ポイント
GeForce RTX 5070
・フルHD:2万7569ポイント
・WQHD(カスタム解像度):2万1303ポイント
・4K:1万1411ポイント
GeForce RTX 4070
・フルHD:2万4687ポイント
・WQHD(カスタム解像度):1万7412ポイント
・4K:1万735ポイント
GeForce RTX 4060
・フルHD:1万6715ポイント
・WQHD(カスタム解像度):1万1432ポイント
・4K:9906ポイント
5060 TiはフルHDなら「非常に快適」、WQHDなら「とても快適」、4K解像度なら「快適」となった。ターゲット解像度がフルHD〜WQHDであることを考えれば、ある意味妥当な結果といえるだろう。
他のGPUとのスコア比較という観点では、同一アーキテクチャのGeForce RTX 5070と比べるとフルHDで11%、WQHDでは32%と解像度が高くなるほどスコア差が広がると思いきや、4Kでは差は8%程度に収まっている。何度かテストを回してもこの傾向に変わりはなかった。
先代アーキテクチャの4060/4070と比べた場合、結果は3DMarkとおおむね同じ傾向となった。やはりアーキテクチャの変更による効率改善は一定の効果はありそうだ。
Cyberpunk 2077(DLSSテスト)
ここ数年、ハイエンドGPUでも処理が重い「超・超重量級ゲーム」が複数登場している。その典型例が、CD PROJECT REDの「Cyberpunk 2077」だ。今回は、本タイトルのゲーム内ベンチマークテスト機能を使って各GPUにおけるDLSS機能の有効性をチェックしてみた。
テストに使ったのは、DLSS 4のマルチフレーム生成に対応した「パッチ2.21」を適用したプログラムだ。時間の都合で、今回は表示解像度を4Kに固定し、一番高負荷なプリセット「レイトレーシング:オーバードライブ」を適用した状態での平均フレームレートを比較する。結果は以下の通りとなった。
・DLSSオン(フレーム生成オフ)
・GeForce RTX 5060 Ti:27.91fps
・GeForce RTX 5070:38.86fps
・GeForce RTX 4070:33.73fps
・GeForce RTX 4060:17.29fps
DLSSオン(フレーム生成2X)
・GeForce RTX 5060 Ti:49.35fps
・GeForce RTX 5070:66.74fps
・GeForce RTX 4070:58.44fps
・GeForce RTX 4060:15.2fps
DLSSオン(フレーム生成3X)
・GeForce RTX 5060 Ti:69.52fps
・GeForce RTX 5070:93.66fps
DLSSオン(フレーム生成4X)
・GeForce RTX 5060 Ti:87.84fps
・GeForce RTX 5070:119.09fps
やはりマルチフレーム生成の効果はてきめんで、マルチフレーム生成を有効にすれば5060 Tiでもそこそこに滑らかな状態で楽しめる。ただ、1ランク上の5070と比べてしまうと、見劣りはする。
本筋からは外れるが、テスト中少し気になったのが4060の結果だ。フレーム生成を有効にすると、むしろフレームレートが落ちてしまう。これは明らかにグラフィックメモリの“不足”が原因だろう。逆にいうと、今回の5070はグラフィックスメモリが16GBだからこそ、オーバーレイプリセットでも“頑張れた”ともいえそうである。
参考に、GeForce RTX 5060 TiではフルHD/WQHD解像度でのテストも実施している。結果は以下の通りだ。
・フルHD
・DLSSオフ(ネイティブ解像度):28.75fps
・DLSSオン(フレーム生成オフ):54.65fps
・DLSSオン(フレーム生成2X):95.89fps
・DLSSオン(フレーム生成3X):138.15fps
・DLSSオン(フレーム生成オフ):176.16fps
WQHD
・DLSSオフ(ネイティブ解像度):17.42fps
・DLSSオン(フレーム生成オフ):42.57fps
・DLSSオン(フレーム生成2X):73.99fps
・DLSSオン(フレーム生成3X):104.86fps
・DLSSオン(フレーム生成オフ):132.03fps
ターゲット解像度ではより高いパフォーマンスを発揮できている……が、オーバードライブはさすがに荷は重そうである。「レイトレーシング:ウルトラ」設定であれば、もう少しフレームレートが上がり、より快適に楽しめる。
●動画のエンコードやAIのパフォーマンスもチェック!
今どきのGPUはゲーミングだけでなく、動画のエンコードやAIの演算処理にも活用されている。今回は、これらパフォーマンスをULの総合ベンチマークテストアプリ「Procyon」に内包されたテストでチェックしてみよう。
Procyon Video Editing Benchmark
GeForce RTX 50シリーズには第9世代NVENC(動画エンコーダー)と第6世代NVENC(動画デコーダー)が内蔵されている。GeForce RTX 5060はNVENCが1基、NVDECが1基という構成だ。これは1ランク上のGeForce RTX 5070と同じなのだが、以下の点が異なる。
・(16GBモデルの場合)使えるグラフィックスメモリが4GB多い
・メモリの帯域幅が削減されている(毎秒672GB→毎秒448GB)
・PCI Expressバスの幅が半減している(16レーン→8レーン)
グラフィックスメモリが増えているのはプラスだが、その帯域幅が削減されているのはマイナスに働きうる。また、PCI Expressバスの幅の半減も、マイナス要素といえる。
実際はどうなのか——Procyonの「Video Editing Benchmark」を使ってチェックしてみよう。このテストは「Adobe Premiere Pro」を使ってフルHD(H.264コーデック)と4K(H.265コーデック)の動画を2種類ずつ書き出す際のパフォーマンスを点数化する。負荷の大きいテストはエフェクト処理でGPUによるアクセラレーションを有効にできる。
総合スコアではなく、あえて書き出しに掛かった時間をチェックしてみると、以下の通りとなる。
・GeForce RTX 5060 Ti
・フルHD/その1(GPUアクセラレーション):26.8秒
・フルHD/その2:22.1秒
・4K/その1(GPUアクセラレーション):68.7秒
・4K/その2:57.3秒
GeForce RTX 5070
・フルHD/その1(GPUアクセラレーション):17.9秒
・フルHD/その2:16秒
・4K/その1(GPUアクセラレーション):54.2秒
・4K/その2:46.8秒
GeForce RTX 4070
・フルHD/その1(GPUアクセラレーション):23.7秒
・フルHD/その2:19.7秒
・4K/その1(GPUアクセラレーション):64.2秒
・4K/その2:53.7秒
GeForce RTX 4060
・フルHD/その1(GPUアクセラレーション):40.9秒
・フルHD/その2:33.5秒
・4K/その1(GPUアクセラレーション):90.4秒
・4K/その2:75.7秒
5070との比較では、やはり5070の方が少し早い。プラス要素よりもマイナス要素の方が大きく出てしまったのだと思われる。
一方で、旧世代の4060と比べると大幅なパフォーマンスアップを果たしている。ただ、4070と比べると微妙に及ばない。これはグラフィックスメモリの帯域幅の差(毎秒448GB対毎秒504GB)が出てしまったと推測される。
5060は8レーン構成だが、PCI Express 5.0バスを備えるシステムであれば動画編集において思った以上に健闘する。旧世代のグラフィックスカードからの置き換えであれば、時短効果は大きいだろう。
Procyon Computer Vision Benchmark
一言で「AI」といっても、さまざまなものがある。ProcyonではAIに関するベンチマークテストがあるが、今回は機械学習データを使って物体を検知する「コンピュータビジョン」の処理パフォーマンスを確認する「AI Computer Vision Benchmark」を実行してみよう。
今回はDirectX 12に内包されている汎用(はんよう)API「Windows ML(Direct ML)」でのテストに加えて、NVIDIA製GPUにおけるネイティブAPI「NVIDIA TensorRT」の両方で演算パフォーマンスをチェックしてみよう。
結果は以下の通りだ。なお「INT」は整数演算、「Float16」は半精度浮動小数点数演算、「Float32」は単精度浮動小数点数演算を意味する。
・GeForce RTX 5060 Ti
・INT:368ポイント(Windows ML)/2972ポイント(TensorRT)
・Float16:1484ポイント(Windows ML)/2568ポイント(TensorRT)
・Float32:760ポイント(Windows ML)/1147ポイント(TensorRT)
GeForce RTX 5070
・INT:465ポイント(Windows ML)/3700ポイント(TensorRT)
・Float16:1797ポイント(Windows ML)/3109ポイント(TensorRT)
・Float32:953ポイント(Windows ML)/1387ポイント(TensorRT)
GeForce RTX 4070
・INT:420ポイント(Windows ML)/3415ポイント(TensorRT)
・Float16:1432ポイント(Windows ML)/2775ポイント(TensorRT)
・Float32:880ポイント(Windows ML)/1425ポイント(TensorRT)
GeForce RTX 4060
・INT:272ポイント(Windows ML)/2648ポイント(TensorRT)
・Float16:1179ポイント(Windows ML)/2142ポイント(TensorRT)
・Float32:594ポイント(Windows ML)/950ポイント(TensorRT)
5060 Tiの16GBモデルは、5070の8割程度のパフォーマンスだった。GPUの仕様を考えれば妥当な結果といえる。旧世代と比べると(内容は異なるが)3DMarkのスコアと同じような傾向がうかがえる。
Windows MLの結果を見てみると、新世代(GeForce RTX 50シリーズ)におけるFloat16の演算パフォーマンスの改善が目を見張る。これも、ある意味での改善要素といえそうだ。
●新しいエントリーGPUとして期待 上位モデルとの「3万円弱差」は要検討
GeForce RTX 5060 Tiは8GBモデルなら6万9800円から、16GBモデルでも7万9800円からと、GeForce RTX 50シリーズとしては手頃な価格が魅力だ。フルHD〜WQHDをターゲットにする人にとっての新しい定番GPUとなりそうな予感はする。
消費電力はシリーズ内では少なめで、今回レビューしたシステムではピーク時で360Wだった。3〜4年前に買ったエントリー〜ミドルレンジデスクトップゲーミングPCのグラフィックスカードの置き換えにピッタリといえそうだ。
ただ、想定価格ベースで2万9000円差のGeForce RTX 5070とはそれなりの性能差がある。組み込むPCの構成(CPUやメモリなど)とのバランスを考慮しつつ、どちらがいいのか検討することをお勧めしたい。
(C)CAPCOM