cudaGraph 发表于 2024-12-01 更新于 2025-12-21 分类于 TensorRT 1 前言根据官方文档的描述,解释一下什么是cudaGraph,其次为什么要使用cudaGraph。 阅读全文 »
2 cuda_context 发表于 2024-12-01 分类于 CUDA , 基础 1 前言在上一篇文章《1-cuda_API》中降到cuda Driver API主要的一个作用就是管理cuda Context,那么这里讲解一下什么是cuda Context 阅读全文 »
CUDA 环境变量 发表于 2024-12-01 分类于 CUDA , 基础 1 简介CUDA 提供了许多环境变量来配置和优化 CUDA 运行时和驱动程序的行为。这些环境变量通常用来控制CUDA的性能、调试和设备行为等。 阅读全文 »
1 cuda_API 发表于 2024-12-01 分类于 CUDA , 基础 1 cuda API简介CUDA是由NVIDIA推出的通用并行计算架构,通过一些CUDA库提供了一系列API供应用程序调用。开发者可调用这些API充分利用GPU来处理图像,视频解码等。 阅读全文 »
cudaMemcpyAsync耗时异常 发表于 2024-12-01 分类于 CUDA , Nsight 1 前言记录一次使用nsigth system来分析一个推理进程异步的内存拷贝耗时异常问题。 阅读全文 »
Nsight System基础 发表于 2024-12-01 分类于 CUDA , Nsight 1 简介该笔记参考深入理解 Nsight System 与 Nsight Compute 性能分析优化工具,并结合自己之前使用nsys的经验进行总结。 阅读全文 »