欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

nvprof工具使用及结果分析,持续更新。。。

程序员文章站 2022-06-07 08:22:08
...

会持续更新。。。

1.介绍


nvprof是用来测试了解并优化CUDA或OpenACC应用程序的性能的分析工具。分析工具使您能够从命令行收集和查看分析数据。

2.基本使用

2.1测试程序时间性能


nvprof ./a.out
a.out为编译后的可执行文件

示例结果如下:
nvprof工具使用及结果分析,持续更新。。。


2.2结果分析


  • Profiling result:是GPU(kernel函数)上运行的时间
  • API calls:是在cpu上测量的程序调用API的时间

3–metrics参数的使用


3.1occupancy

nvprof --metrics achieved_occupancy ./a.out

3.2gld_throughput

nvprof --metrics gld_throughput ./a.out

3.3gdl_efficiency

“`
nvprof –metrics gld_efficiency ./a.out


参考文章


http://www.bubuko.com/infodetail-1120850.html
官网:https://docs.nvidia.com/cuda/profiler-users-guide/