当前位置：代码网 > it编程>编程语言>C/C++ > Fast Fourier Convolution

Fast Fourier Convolution

2024年08月01日 • C/C++ •我要评论

FFC

fast fourier convolution

背景：

感受野的概念：卷积神经网络每一层输出的特征图（feature map）上的像素点映射回输入图像上的区域大小

例如：

扩大感受野的方法：非局部神经网络、膨胀卷积或可变形卷积

非局部神经网络：为了确定某个位置的新值，它计算该位置与所有其他位置的相似性得分，然后对所有位置的特征进行加权平均。

其中i为输入位置，j为所有搜索的位置

缺点：低效率

膨胀卷积或可变形卷积：本质上还是局部的，需要堆叠很多层才能获得大感受野

缺点：深度网络优化更困难、容易产生伪影。

创新点：

提出了一个新的卷积模块，fast fourier convolution(ffc) ，不仅有非局部的感受野，而且在卷积内部就做了跨尺度信息的融合。

ffc构架：

ffc由两条相互连接的路径组成：一条在部分输入特征信道上进行普通卷积的空间（局部）路径，以及一条在频谱域中工作的频谱（全局）路径。每条路径都可以捕获具有不同感受野的互补信息。

fourier unit(fu)

性质1：对实信号应用二维fft时，会产生完全对称的厄米特矩阵，对厄米特矩阵应用逆fft时矩阵只有实元素。当用实张量进行fft变换时，其结果是共轭对称的。因此，在不损失有用信息的情况下，我们可以只保留一半的结果，并通过使用共轭对称简单地恢复另一半。

性质2：傅里叶理论中的频谱卷积定理：更新频谱域中的单个值会影响空间域中全局的特征。

对于频谱变换器来说，大的核尺寸是不必要的，因为在频谱域中的任何操作都具有全局感受野。

local fourier unit(lfu)

目的是捕捉半全局信息，做法是将input feature map分为4个patch，分别使用fu即可。

与fu相比，lfu需要更高的计算复杂度，这主要是由于增加了信道。lfu的效果因具体任务而异

复杂性分析：

ffc与普通卷积相比，计算成本相当，但当普通卷积使用大核卷积时，ffc体现了优越性，在频谱转换器时仍然使用1×1的核来学习全局感受野。

总结：提出了一种新的卷积算子，称为ffc。它利用傅里叶光谱理论在深度模型中实现非局部感受野。所提出的算子也经过设计以实现跨尺度融合。在三个具有代表性的计算机视觉任务上的综合实验证明ffc的有效性。

应用到图像修复当中

resolution-robust large mask inpainting with fourier convolutions

背景：

针对问题：复杂几何结构的高分辨率图像缺失较大时修复效果不好。

作者认为：主要原因之一是修复网络和损失函数都缺乏有效感受野。

创新点：

1、提出了基于快速傅里叶卷积(ffc)的修复网络，可以在网络比较浅的层就有覆盖图像的感受野

2、应用了具有高感受野的语义分割网络的感知loss

3、引入了一种训练掩码生成的策略，可以生成多样性的mask。

方法：

问题定义：

在大掩模修复中，需要充分的考虑全局的上下文信息。因此一个好的架构需要在网络比较浅的地方就能够有较宽的感受野，对于宽掩模，特定位置的生成器的整个感受野可能在掩模内部，因此仅观察丢失的像素。对于高分辨率图像，这个问题变得尤为突出，不太适用。

快速傅里叶卷积(ffc)：ffc是可以在浅层中使用全局上下文的算子，ffc基于通道级别的fft，并且有覆盖整个图像的感受野。

ffc设计上在通道级别分为两个分支：使用传统卷积的局部分支和使用fft获取全局上下文信息的全局分支。

在重复结构上的修复示例

ffc可以在网络的浅层就开始考虑全局上下文信息，对于高分辨率图像来说十分有用。同时ffc非常适合捕获周期性的结构

loss的设计：

原始的监督损失要求生成器尽可能地去还原 ground truth。但是当遮挡区域很大时，已有的可见区域的信息不足以还原，因此模型会做出很多模棱两可的判断，从而导致模糊。

利用一个预训练模型来评估预测图和目标图之间的距离。因为针对large mask 的修复问题的重点是理解图像的全局结构，因此不需要精确的还原，允许有一定的变化。

预训练模型的选取也很重要，分割模型会关注图像的高级语义信息，而分类模型可能会更关注图像的纹理。

大掩膜训练：

实验结果：超过了以往的 sota 模型，鲁棒性更好，扩展到高分辨率图像同样适用，且参数量和时间也更少。

存在不足：

1、对于变形的周期信号复原结果不佳。

2、在透视与复杂背景上表现不好

赞 (0)

相关文章:

2024年亚太中文赛数学建模竞赛B题洪水灾害的数据分析与预测详细思路解析

解题方法：首先就是概率聚类，可以使用层次聚类和kmeans聚类等模型，题目给出需要聚类成高、中、低风险三类，之后选取合适的指标，计算不同指标的权重，建立发生洪水不同风险的预警评价模…

2024年08月01日 • 编程语言
【数据分析】Excel中使用VBA进行宏编程

从开发者角度看，Excel VBA应用程序由工作表、用户窗体、模块和类模块等部分构成。工作表：用于保存和显示程序的数据，是程序的主体部分。一般先在工作表中制作出特定表格的格式，并设…

2024年08月01日 • 编程语言
详细讲解ABTest假设检验【实验设计&amp；结论分析】数据分析_abtest 假设检验(3)

这里其实我在上篇博客讲到的就是说如果明确是要提升或者明确下降的话（有>或…

2024年08月01日 • 编程语言
运用TableAgent 数据分析智能体分析人才数据集开启数据分析的新篇章

在当今数字化时代，数据分析已成为企业决策和业务发展中不可或缺的一环。然而，随着数据量的不断增长和多样化，传统的数据分析方法已无法满足对复杂数据的深入挖掘和理解。为了应对这一挑战，我…

2024年08月01日 • 编程语言
基于人脸识别的考勤系统（Qt+opencv+Arm）测试报告

当我们运行客户端之后，红色的圈会追踪人脸，识别到人脸之后直接在人脸考勤系统右侧显示工号、姓名、部门、和打卡时间，在服务器端点击考勤图像直接显示当前考勤人脸。当我们打开客户点进行人脸…

2024年08月01日 • 编程语言
[C++] opencv - HoughCircles(霍夫圆查找)函数介绍和使用场景

本文介绍了如何通过opencv的HoughCircles函数去找到灰度图像上的圆，霍夫圆检测能检测出目标图像中存在的圆，但在实际使用中，参数调节存在很大的困难。参数设置不合理会不仅…

2024年08月01日 • 编程语言

版权声明：本文内容由互联网用户贡献，该文观点仅代表作者本人。本站仅提供信息存储服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 2386932994@qq.com 举报，一经查实将立刻删除。

发表评论


验证码：

Copyright © 2017-2026 代码网保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱：2386932994@qq.com