永らくお待たせいたしました! 次の2.5ビルドの1つに、redshiftのbinフォルダに新しいユーティリティ、「redshiftBenchmark」が含まれています。そのユーティリティは、シーンを読み込んでレンダリングし、時間を測定し、情報を出力します。
最初は、このユーティリティは少し見た目が悪いかもしれません:実行するには、コマンドラインを使用する必要があり、実行中にレンダリングビューなどが表示されません。 いくつかの情報(フォーラムでコピー/貼り付けを行い、他のユーザーと共有することができる)をプリントし、redshiftBenchmarkOutput.pngというイメージを保存します。 redshiftBenchmarkOutput.pngという名前の画像を保存します。これは、透かしと共に、(間違いがないことを保証するために)レンダリングされたものを表示します。
サンプルについては添付のスクリーンショットをご覧ください。
私はあなたたちは私が多くの質問を持っていると推測し、そのうちのいくつかに答えることを試みました。
FAQ
Q:なぜ実装に時間がかかったのですか?
A: Redshiftは積極的に開発が行われ、そのパフォーマンスはバージョン間で一時的に変化します。 たとえば、新しい機能を導入すると、レンダラーが少し遅くなる可能性がありますが、開発チームは1年を通して複数の「最適化パス」を実行し、すべてが高速(またはより高速)になります。 このため、このユーティリティをリリースする前に、Redshiftの重要な変更がオンラインになるのを待たなければなりませんでした。 上記の説明は、特定のRSバージョンで取得したベンチマークデータと他のバージョンで取得したデータを比較することができないことを意味します。
Q: "Vultures"シーンは良いベンチマークシーンですか? 自分のシーンでGPU間での同じ相対的なパフォーマンスを確認できますか?
A:Redshiftの公式ベンチマークシーンでは、Redshiftの機能のかなりの部分が使用されています。 1つのシーンはすべてのシナリオを100%説明することはできませんが、このシーンで発生する処理とデータアクセスのタイプはさまざまなシナリオを説明していると考えています。 将来的には、Redshiftのより具体的な側面を対象とするより多くのベンチマークシーンを紹介するかもしれません。
Q:CPUのパフォーマンスはレンダリング時間に影響しますか?
A:ユーティリティから報告される最終的な時間には、ディスクからデータをロードする時間や、レンダリングを開始する前に何らかの前処理を行う時間は含まれません。 それでも、CPUのパフォーマンスは、GPUがどのくらい速く動作するかに影響を与え、低速のCPU(低GHz)はGPUを「枯渇」させ、全体のレンダリング性能を低下させる可能性があります。
Q:より多くのVRAMを搭載したGPUはレンダリング速度が向上しますか?
A:ベンチマークツールは、「Automatic VRAM management(自動VRAM管理」と呼ばれるRedshift機能を使用します。 この機能は、GPUに十分な空きVRAMがある場合、Redshift内の特定のメモリ設定(「レイ予約メモリ」など)を自動的に調整します。 場合によっては、そうすることで速度が上がることがあります。なので、イエスです。VRAMの多いGPUは高速化できます。
Q:このシーンではコアのパフォーマンスがテストされていますか?
A:いいえ、そうではありません。 このシーンは、他のアプリで多くのVRAMが使用されているローエンドGPUについて話している場合を除き、「out-of-core」を引き起こすほど重くはありません。
Q:ベンチマーク結果はありますか?
A:はい! 次のリンクをご参照ください。https://www.redshift3d.com/forums/viewthread/12843/
Q:ベンチマークツールが利用できるようになったら、結果をどこに報告しますか?
A:https://www.redshift3d.com/forums/viewthread/12843/
Q:これを他のシーンを使うことはできますか?
A:はい! Redshiftプロキシとしてエクスポートされたシーンはすべて使用できます。 シーン(.rsファイル)は、このユーティリティのコマンドラインパラメータです。 しかし、混乱を避けるため(そして、あまりにも多くの異なるシーンで沢山の異なる結果がでることを避けるため)、公式のシーンを利用することをお勧めします。
Q:ベンチマークはなぜ実行に時間がかかるのですか?
A:これは意図的なものです。 このシーンをさまざまなハードウェアのセットアップやGPUの世代にわたって使用したいと考えています。 適度なGPUでレンダリングするのに数分かかった場合、強力なマルチGPUマシンではおそらく数秒になるでしょう。ベンチマークの実行がわずか数秒でおわると、無作為なマシン要素が結果に劇的に影響する可能性があります。 だから、ベンチマークを実行して、あらゆる種類のパフォーマンスを「均等」にして一貫した結果を出せるようにするのがベストです。
Q:OK、お話は十分です、 これはいつリリースされる予定ですか?
A:現在、いくつかの仕上げを行っています。 ユーティリティはおそらく2.5.18または2.5.19でリリースされるでしょう。 これは2.5ビルドでのみ利用可能であることに注意してください。
結論
免責事項:これらの時間は、まだ開発中のコードで得られたため、正確ではない可能性があります。
時間は、約3.5GHz程度で我々がオフィスに持っているいくつかの異なるチップセットX99 Corei7マシン上のRSバージョン2.5.17で実行されました。
時間は分:秒で表示されます。
OS | CPU | GPU | Time |
Windows | 8 threads, 2.81GHz | GeForce GTX 780 3GB | 31.05 |
MacOS | 12 threads, 3.5GHz | GeForce GTX 970 4GB | 27.22 |
Windows | 12 threads, 3.4GHz | GeForce GTX 780Ti 3GB | 25.58 |
Windows | 12 threads, 3.5GHz | GeForce GTX 980 4GB | 23.21 |
Windows | 12 threads, 3.5GHz | GeForce GTX 1070 8GB | 17.11 |
MacOS | 8 threads, 2.9GHz | GeForce GTX 1080 8GB | 16.00 |
Windows | 12 threads, 3.5GHz | Quadro M6000 24GB | 15.42 |
Windows | 12 threads, 3.5GHz | GeForce GTX TITANX 12GB | 15.40 |
Linux | 12 threads, 3.8GHz | GeForce GTX 1070 8GB | 15.05 |
Windows | 12 threads, 3.5GHz | Quadro M6000 24GB TCC | 14.33 |
MacOS | 12 threads, 3.5GHz | GeForce GTX TITANX 12GB | 14.25 |
Linux | 12 threads, 3.5GHz | Quadro M6000 12GB | 14.23 |
Linux | 12 threads, 3.78GHz | GeForce GTX TITAN X 12 GB | 14.07 |
Windows | 12 threads, 3.5GHz | Quadro P6000 24GB | 12.30 |
Windows | 12 threads, 3.5GHz | GeForce GTX TITANX Pascal 12GB | 11.59 |
Windows | 12 threads, 3.4GHz | GeForce GTX 1080 Ti 11 GB | 11.44 |
Windows | 12 threads, 3.5GHz | Quadro P6000 24GB TCC | 11.31 |
Windows | 32 threads, 2.6GHz | GeForce GTX 1060 6GB x 2 | 11.07 |
Windows | 12 threads, 3.5GHz | GeForce GTX TITANX Pascal 12GB TCC | 10.54 |
Windows | 12 threads, 3.5GHz | Quadro GP100 16GB | 9.57 |
Windows | 12 threads, 3.5GHz | Quadro GP100 16GB TCC | 8.43 |
Windows | 8 threads, 4.0GHz | GeForce GTX 1070 8GB x 2 | 8.06 |
Linux | 12 threads, 3.79GHz | GeForce GTX 1070 8GB x 2 | 7.39 |
Windows | 20 threads, 4.3GHz | GeForce GTX 980Ti 6GB x 2 | 7.35 |
Windows | 12 threads, 3.29Hz | GeForce GTX 1080 8GB x 2 | 7.26 |
MacOS | 8 threads, 4.00GHz | GeForce GTX 1080 Ti 11GB x 2 | 6.30 |
Windows | 12 threads, 3.5GHz | Quadro P6000 24GB x 2 | 6.28 |
Windows | 16 threads, 2.99GHz | GeForce GTX 1080 Ti 11GB x 2 | 6.15 |
Windows | 12 threads, 3.5GHz | Quadro P6000 24GB TCC x 2 | 5.55 |
Windows | 12 threads, 3.5GHz | Quadro GP100 16GB x 2 | 5.04 |
Windows | 56 threads, 2.3GHz | GeForce GTX 980 Ti 6GB x 4 | 4.48 |
Windows | 16 threads, 4.3GHz | GeForce GTX TITAN X 12 GB x 4 | 4.28 |
Windows | 12 threads, 3.5GHz | Quadro GP100 16GB TCC x 2 | 4.25 |
Windows | 12 threads, 3.5GHz | GeForce GTX 1070 8GB x 4 | 4.15 |
Windows | 32 threads, 2.1GHz | GeForce GTX 1080Ti 11GB x 4 | 3.25 |
Windows | 36 threads, 2.35GHz | GeForce GTX 1080Ti 11GB x 4 | 3.21 |
Windows | 12 threads, 3.6GHz | GeForce GTX 1080Ti 11GB x 4 | 3.07 |
Windows | 32 threads, 2.1GHz | GeForce GTX 1080Ti 11GB x 8 | 1.57 |