NVIDIA Nsight Compute基本使用
2024-06-19 本文已影响0人
寽虎非虫003
首先命令行执行你的程序
nv-nsight-cu-cli -o report.ncu-rep --set full <your_application> <application_args>
这将运行你的 CUDA 应用程序并生成一个名为 report.ncu-rep 的详细报告。
然后使用 Nsight Compute 的 GUI 版本打开 .ncu-rep 文件,可以图形化查看各种性能指标。
如下,可以看到我的程序有一项问题很大。
![](https://img.haomeiwen.com/i19536936/52f3cd15e71f4ef3.png)