当前位置: 代码网 > 科技>人工智能>数据分析 > 目标检测YOLO实战应用案例100讲-基于双模特征融合的目标检测(续)

目标检测YOLO实战应用案例100讲-基于双模特征融合的目标检测(续)

2024年08月04日 数据分析 我要评论
检测头由1×1卷积和3×3卷积组成,先用1×1卷积调整通道数,3×3卷积整合FFM 输出后的特征。用于预测的输出特征图尺寸为N×N×(num+5)×2,其中num是类别数, N×N是输出特征图中的尺寸。第一个是FLIR红外数据集[51],数据集共有7859张图像,划 分为6287张训练图像和1572张测试图像,目标类别数为4。在训练过程中,使用SGD更新参数,动量参数设为0.9,BatchSize设为8,共训练 150个Epochs,初始学习率为0.0001。参数量最低,复杂度低,模型易于迁移。

目录

3.2.3特征融合模块

3.3实验结果及分析

3.3.1实验设置

3.3.2消融实验与定性分析

3.3.3对比实验与定量分析

基于双模态融合网络的目标检测算法

4.1引言

4.2基于双模态融合网络的目标检测算法

4.2.1算法总体框架

4.2.2双模态编码器

4.2.3门控融合网络

4.3实验结果及分析

4.3.1实验设置

4.3.2消融实验与定性分析

4.3.3对比实验与定量分析

基于双模特征对齐的目标检测算法

5.1引言

5.2基于双模特征对齐的目标检测算法

5.2.1算法总体框架

5.2.2双模特征对齐模块

5.2.3特征融合模块

5.3实验结果及分析

5.3.1实验设置

5.3.2消融实验与定性分析

5.3.3对比实验与定量分析


本文篇幅较长,分为上下两篇,上篇详见基于双模特征融合的目标检测

3.2.3特征融合模块


图像分辨率高时,浅层的特征主要集中于小目标,提取到丰富的空间信息但语义信
息较少。反之,深层的特征能提取到更丰富的语义信息,但图像分辨率较低。backbone检测头由1×1卷积和3×3卷积组成,先用1×1卷积调整通道数,3×3卷积整合ffm 输出后的特征。用于预测的输出特征图尺寸为n×n×(num+5)×2,其中num是类别数, n×n是输出特征图中的尺寸。在后续实验中,利用k-means++对每个数据集中的标签框 聚类,由于只使用两支检测头,则预设6个不同尺寸的先验框。

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com