1 cuda_API 发表于 2024-12-01 分类于 CUDA , 基础 1 cuda API简介CUDA是由NVIDIA推出的通用并行计算架构,通过一些CUDA库提供了一系列API供应用程序调用。开发者可调用这些API充分利用GPU来处理图像,视频解码等。 阅读全文 »
cudaMemcpyAsync耗时异常 发表于 2024-12-01 分类于 CUDA , Nsight 1 前言记录一次使用nsigth system来分析一个推理进程异步的内存拷贝耗时异常问题。 阅读全文 »
Nsight System经验 发表于 2024-12-01 分类于 CUDA , Nsight 1 简介看了官方的说明文档还是有一点云里雾里,这里说明一些使用nsisght systems过程中的经验之谈。 阅读全文 »
Nsight System基础 发表于 2024-12-01 分类于 CUDA , Nsight 1 简介该笔记参考深入理解 Nsight System 与 Nsight Compute 性能分析优化工具,并结合自己之前使用nsys的经验进行总结。 阅读全文 »
Nsight Compute示例1_总览 发表于 2024-12-01 分类于 CUDA , Nsight 理论看了很多,但是感觉脑袋空空,为什么?因为没有实际应用。那么这一节开始使用Nsight Compute来在orin上进行Kernel的分析。来真正的看看如何结合工具来优化一个kernel。 首先需要知道Nsight Compute都会告诉我们哪些内容。 阅读全文 »
7 调整指令级原语 发表于 2024-12-01 分类于 CUDA , CUDA C编程权威指南笔记 前言这一章讲的内容我暂时没有什么使用到,因此没有什么理解,除了原子操作。因此先给出一个看到的重点的大纲,需要的时候再补充吧。 阅读全文 »