13-TensorRT的最佳性能实践
发表于
分类于
TensorRT
,
TensorRT中文版开发手册
12-TensorRT和DLA(Deep_Learning_Accelerator)
发表于
分类于
TensorRT
,
TensorRT中文版开发手册
11-TensorRT之使用条件
发表于
分类于
TensorRT
,
TensorRT中文版开发手册
10-TensorRT中的循环
发表于
分类于
TensorRT
,
TensorRT中文版开发手册
TensorRT与onnx
发表于
分类于
TensorRT
1-简介
发表于
分类于
TensorRT
,
TensorRT中文版开发手册
TensorRT-plugin
发表于
分类于
TensorRT
TensorRT INT8量化代码
发表于
分类于
TensorRT
Calibration file
发表于
分类于
TensorRT
1 简介
我们在使用Tensorrt的隐形量化时,需要生成一个cache文件,用于onnx生成engine文件使用。如果我们使用trtexec
来将onnx文件生成为和我们的GPU相关的隐形量化后的engine文件时需要参数 参考A.2.1.2. Serialized Engine Generation A.2.1.4. Commonly Used Command-line Flags