理论看了很多,但是感觉脑袋空空,为什么?因为没有实际应用。那么这一节开始使用Nsight Compute来在orin上进行Kernel的分析。来真正的看看如何结合工具来优化一个kernel。

首先需要知道Nsight Compute都会告诉我们哪些内容。

阅读全文 »

5.5 常量内存

常量内存是一种专用的内存,它用于只读数据和统一访问线程束中线程的数据。常量内存对内核代码而言是只读的,但它对主机而言既是可读又是可写的。
常量内存位于设备的DRAM上(和全局内存一样),并且有一个专用的片上缓存。和一级缓存和共享内存一样,从每个SM的常量缓存中读取的延迟,比直接从常量内存中读取的低得多。每个SM常量内存缓存大小的限制为64KB。

阅读全文 »
0%