当前位置: 代码网 > 科技>人工智能>车联网 > 【yolov8系列】yolov8的目标检测、实例分割、关节点估计的原理解析

【yolov8系列】yolov8的目标检测、实例分割、关节点估计的原理解析

2024年07月28日 车联网 我要评论
对前两者进行解析可得到,有效的gridceil预测出了目标的类别 和 目标的box,此时可以很容易获取该gridceil中的目标的mask_coef,维度为32,刚好与Proto输出的channel维度32相一致。不同mask为网络学习到不同的掩码信息,值得注意的是单张mask并不意味着mask中只有一个目标的mask。2 仅保留该gridceil检测出的box内的mask,然后再对mask框内的mask的每个像素进行阈值过滤(工程中阈值设为0.5),即得到该目标的最终的mask。
  • box 的 gt_class --> target_class

    • ciou:以往box检测框的损失函数都会使用的一项。
      考虑三种几何参数:重叠面积、中心点距离、长宽比。ciou就是在diou的基础上增加了检测框尺度的loss,增加了长和宽的loss,这样预测框就会更加的符合真实框。
    • distribution focal loss (dfl):使用向量表达边界与基准点的距离,然后结合softmax交叉熵计算得dfl项的loss
      将边界距离基准点的距离记为y,则可将基准点转换为(tl, tr),两者对应的权重为(wl, wr)。y.shape = tl.shape = tr.shape= [batch, n, 4]。
      tl.view(-1).shape = tr.view(-1).shape = [batc*n*4](假设左边界距离y=5.6,则 t l = 5 tl=5 tl=5 t r = 6 tr=6 tr=6 t l = 0.4 tl=0.4 tl=0.4 w r = 0.6 wr=0.6 wr=0.6
      此时网络输出的边界为pred_dist,pred_dist.shape=[batc*n*4,16]。则损失函数如下,:
      loss =  (f.cross_entropy(pred_dist, tl.view(-1), reduction='none').view(tl.shape) * wl +
      			  f.cross_entropy(pred_dist, tr.view(-1), reduction='none').view(tl.shape) * wr).mean(-1, keepdim=true)
      
  • (0)

    相关文章:

    版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

    发表评论

    验证码:
    Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
    站长QQ:2386932994 | 联系邮箱:2386932994@qq.com