当前位置：代码网 > 科技>人工智能>车联网 > 【yolov8系列】yolov8的目标检测、实例分割、关节点估计的原理解析

【yolov8系列】yolov8的目标检测、实例分割、关节点估计的原理解析

2024年07月28日 • 车联网 •我要评论

对前两者进行解析可得到，有效的gridceil预测出了目标的类别和目标的box，此时可以很容易获取该gridceil中的目标的mask_coef，维度为32，刚好与Proto输出的channel维度32相一致。不同mask为网络学习到不同的掩码信息，值得注意的是单张mask并不意味着mask中只有一个目标的mask。2 仅保留该gridceil检测出的box内的mask，然后再对mask框内的mask的每个像素进行阈值过滤（工程中阈值设为0.5），即得到该目标的最终的mask。

box 的 gt_class --> target_class

ciou：以往box检测框的损失函数都会使用的一项。
考虑三种几何参数：重叠面积、中心点距离、长宽比。ciou就是在diou的基础上增加了检测框尺度的loss，增加了长和宽的loss，这样预测框就会更加的符合真实框。
distribution focal loss (dfl)：使用向量表达边界与基准点的距离，然后结合softmax交叉熵计算得dfl项的loss
将边界距离基准点的距离记为y，则可将基准点转换为(tl, tr)，两者对应的权重为(wl, wr)。y.shape = tl.shape = tr.shape= [batch, n, 4]。
tl.view(-1).shape = tr.view(-1).shape = [batc*n*4]（假设左边界距离y=5.6，则 $tl = 5$ ， $t r = 6$ ， $tl = 0.4$ ， $w r = 0.6$ ）
此时网络输出的边界为pred_dist，pred_dist.shape=[batc*n*4,16]。则损失函数如下，：
```
loss =  (f.cross_entropy(pred_dist, tl.view(-1), reduction='none').view(tl.shape) * wl +
			  f.cross_entropy(pred_dist, tr.view(-1), reduction='none').view(tl.shape) * wr).mean(-1, keepdim=true)
```

赞 (0)

相关文章:

目标检测：如何将VOC标注的xml数据转为YOLO标注的txt格式，且生成classes的txt文件

根据VOC标注的xml文件生成YOLO格式的txt文件，且生成yolo需要的类别txt文件…

2024年07月31日 • 人工智能
YOLO-World：实时开放词汇目标检测

Open Vocabulary：开放词汇论文链接：https://arxiv.org/pdf/2401.17270.pdfYou Only Look Once ... [阅读全文]
目标检测之SSD——全面讲解SSD的概念和原理

作者：禅与计算机程序设计艺术 1.简介“单个尺度目标检测器”（Single Shot Detector，SSD）是当前最... [阅读全文]
目标检测标注工具Labelimg安装与使用

此外，XML文件中还可能包含其他相关信息，例如物体框的遮挡情况(pose)、是否被截断（truncated）、是否是难检测（difficult）物体等。每个XML文件对应一个图像文…

2024年07月31日 • 人工智能
MindMap：利用知识图谱中的精确、全面信息，并通过大模型进行有效的语义处理和推理

总体而言，MindMap通过创新性地融合知识图谱和大型语言模型，克服了单纯依赖LLM处理复杂查询时的多种限制，为用户提供了更精确、可靠、透明和解释性强的解决方案。MindMap 通…

2024年08月01日 • 人工智能
YOLOv8-ROS-noetic+USB-CAM目标检测

Anaconda-yolov8虚拟环境。…

2024年08月01日 • 人工智能

版权声明：本文内容由互联网用户贡献，该文观点仅代表作者本人。本站仅提供信息存储服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 2386932994@qq.com 举报，一经查实将立刻删除。

发表评论


验证码：

Copyright © 2017-2025 代码网保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱：2386932994@qq.com