当前位置: 代码网 > 科技>电脑产品>CPU > CVPR 2024最佳论文分享:打破刚性的超分辨率图像处理GNN

CVPR 2024最佳论文分享:打破刚性的超分辨率图像处理GNN

2024年07月28日 CPU 我要评论
本文介绍了CVPR2024的最佳论文,该论文提出了一种基于图的超分辨率方法IPG。通过灵活的图结构打破传统方法的刚性限制,并在多个基准数据集上展示了其优越的性能。论文详细设计并训练了IPG模型,并进一步验证了该模型能够在超分辨率任务中取得显著提升。

cvpr(conference on computer vision and pattern recognition)是计算机视觉领域最有影响力的会议之一,主要方向包括图像和视频处理、目标检测与识别、三维视觉等。近期,cvpr 2024 公布了最佳论文。共有10篇论文获奖,其中2篇最佳论文,2篇最佳学生论文,2篇最佳论文题目和4篇最佳学生论文提名。本公众号推出cvpr 2024最佳论文专栏,分享这10篇最佳论文。

本文详细介绍了cvpr 2024最佳论文《image processing gnn: breaking rigidity in super-resolution》。该论文的第一作者为北京大学博士田雨川。论文针对超分辨率图像重建中的刚性问题,提出了一个新的图神经网络模型ipg,通过灵活的图结构提升超分辨率性能。本文由李杨撰写,审校为朱旺和陆新颖。

1.研究背景与解决的关键问题

超分辨率(super-resolution, sr)是指从低分辨率图像重建高分辨率图像。在现有的sr方法中,卷积神经网络(convolutional neural network,cnn)和基于自注意力机制的transformer模型是主要的两大类方法。然而,这些方法在操作上存在刚性问题:每个像素聚集相同数量的邻近像素信息,导致在细节丰富的图像部分上重建效果不佳。论文提出了一种基于图的超分辨率方法(image processing gnn,ipg),通过灵活的图结构(graph structure)打破传统方法的刚性限制,提升超分辨率性能。

2.方法

(1)模型架构

图1 ipg模型的总体架构

其中, 多尺度聚合块(multiscale graph-aggregation blocks,mgb):负责从局部和全局尺度聚合信息。图聚合层(graph aggregation layers,gal):执行图聚合操作,聚合局部和全局信息。图构建:在每个mgb块中,分别执行局部和全局采样,构建图结构,交替分配给gal层进行聚合操作。

(2)优势
1)度灵活性

在传统方法中,每个像素聚集相同数量的邻域像素信息,这种“度等效刚性”在sr任务中显得不合理。论文提出了一种度灵活性的图解决方案,基于细节丰富的图像部分,设计了一种度变异图结构。具体来说,通过设计一个细节感知指标(detail-rich indicator metric,df),对图像节点的重要性进行度量,并将更高的度分配给细节丰富的节点。

2)像素节点灵活性

在图像图结构中,论文采用像素而非图像块作为图节点,以避免由于图块刚性导致的对齐问题。相比之下,像素节点能够更灵活地找到其相关像素进行聚合,从而避免像素对齐问题。

3)空间灵活性

论文提出了一种结合局部和全局采样的像素节点连接搜索策略,以聚合局部和全局信息。局部采样在节点周围的邻域中选择,构建局部图;全局采样在整个图像上以扩展模式选择,构建全局图。通过这种方式,图能够灵活地聚合局部和全局信息,从而提升sr性能。

4)图聚合

在图聚合过程中,论文采用边缘条件聚合(edge-conditioned aggregation),这种方法在保持邻域信息的同时,关注像素之间的关系,适用于低级视觉任务。通过在节点特征中加入相对位置编码,增强位置信息,进一步提升图聚合的效果。

3.实验结果

图2 ipg-s和ipg与sr基线在flops和性能方面的比较

所提出的 ipg-s 和 ipg 与 sr 基线在浮点运算次数(floating point operations per second,flops)和性能方面的比较。由于图结构的灵活性,ipg 在类似的 flops下可以比其他 sr 模型高出0.1db。值得注意的是,flops仅反映理论计算成本,而不反映实际推理速度。

表1 ipg与其他sr方法在多个基准数据集上的比较

表1展示了ipg与其他sr方法在多个基准数据集上的详细比较。结果显示,ipg在峰值信噪比(peak signal-to-noise ratio,psnr)和结构相似性(structural similarity,ssim)指标上均取得了显著的提升。

4.可视化

图3与最新 sr 基线的视觉比较

图3展示了在urban100数据集上的可视化结果对比。可以看到,ipg模型在细节重建方面表现优异,重建出的图像细节更加清晰,伪影更少。

5. 结论

论文提出了一种基于图的超分辨率方法ipg,通过灵活的图结构打破传统方法的刚性限制,提升超分辨率性能。实验结果表明,ipg在多个基准数据集上的表现优于现有的sr模型。论文设计了度灵活图、像素节点和空间灵活性策略,使得ipg能够充分利用图的灵活性,在超分辨率任务中取得了显著的提升。

图片

扫码关注我们

微信号:人工智能怎么学

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com