相机坐标系和标定

发表于 2024-12-01 分类于 DeepLearning ，基础

1 针孔模型Pinhole mode

在科学研究中，一个现象内部的过程总是复杂而难以清晰看透，而聪明的学者们总会用最简单的模型去做初始描述，提出一个相对简单的模型。成像过程亦不例外，他们将三维世界中的坐标点映射到二维图像平面的过程用一个几何模型进行描述，这个模型有很多种，其中最简单的称为针孔模型。

阅读全文 »

目标检测基础

发表于 2024-12-01 分类于 DeepLearning ，基础

对计算机而言，能够“看到”的是图像被编码之后的数字，但它很难理解高层语义概念，比如图像或者视频帧中出现的目标是人还是物体，更无法定位目标出现在图像中哪个区域。目标检测的主要目的是让计算机可以自动识别图片或者视频帧中所有目标的类别，并在该目标周围绘制边界框，标示出每个目标的位置，如图1 所示。

阅读全文 »

目标检测mAP计算

发表于 2024-12-01 分类于 DeepLearning ，基础

1 什么是mAP

mAP（mean Average Precision 平均精度），是一个经常被用来衡量目标检测模型是否具有较好性能的指标。

阅读全文 »

双线性插值

发表于 2024-12-01 分类于 DeepLearning ，基础

1 前言

在深度学习中，一般我们有一张图片输入到模型中，需要提前对图片进行前处理。

阅读全文 »

卷积神经网络基础

发表于 2024-12-01 分类于 DeepLearning ，基础

简介

卷积神经网络：卷积神经网络（Convolutional Neural Networks, CNN）是计算机视觉技术最经典的模型结构。本教程主要介绍卷积神经网络的常用模块，包括：卷积、池化、激活函数、批归一化、丢弃法等。

阅读全文 »

关于onnx的resize层

发表于 2024-12-01 分类于 DeepLearning ，基础

1 resize层多出了一个roi输入

我使用下面的代码编写一个简单的网络，包含conv、relu、resize层，并保存为onnx文件。

阅读全文 »

ROI pooling

发表于 2024-12-01 分类于 DeepLearning ，基础

1 简介

文章翻译自：https://deepsense.ai/region-of-interest-pooling-explained/

阅读全文 »

NCHW和NHWC

发表于 2024-12-01 分类于 DeepLearning ，基础

1 简介

在深度学习中，为了提升数据传输带宽和计算性能，image 或 feature map在内存中的存放通常会使用NCHW、NHWC 和CHWN 等数据格式。例如常用的深度学习框架中默认使用NCHW的有caffe、NCNN、pytorch、mxnet等，默认使用NHWC的有tensorflow、openCV等

阅读全文 »

8 MobileNetv3

发表于 2024-12-01 分类于 DeepLearning ，图像分类网络

1 前言

最近在b站发现了一个非常好的计算机视觉 + pytorch 的教程，相见恨晚，能让初学者少走很多弯路。
因此决定按着up给的教程路线：图像分类→目标检测→…一步步学习用pytorch实现深度学习在cv上的应用，并做笔记整理和总结。

阅读全文 »

7 MobileNet

发表于 2024-12-01 分类于 DeepLearning ，图像分类网络

1 前言

最近在b站发现了一个非常好的计算机视觉 + pytorch 的教程，相见恨晚，能让初学者少走很多弯路。
因此决定按着up给的教程路线：图像分类→目标检测→…一步步学习用pytorch实现深度学习在cv上的应用，并做笔记整理和总结。

阅读全文 »

0%