图像梯度表示图像中像素强度的变化率和方向。它是图像分析中的一个基本概念,广泛应用于边缘检测、特征提取和物体识别等任务。opencv 提供了多种计算图像梯度的函数。本文将介绍几种常用的梯度算子及其在 c++/opencv 中的实现。
预备知识
在开始之前,请确保您已经安装了 opencv,并且您的 c++ 开发环境已经配置好可以链接 opencv 库。
通常,我们需要包含以下头文件:
#include <opencv2/opencv.hpp> // 包含所有核心和contrib模块 #include <iostream>
为方便起见,我们也会使用 cv
命名空间:
using namespace cv; using namespace std;
1. 图像加载与预处理
梯度计算通常在灰度图像上进行,因为颜色信息对于梯度方向的确定可能会引入不必要的复杂性。
int main(int argc, char** argv) { // 1. 加载图像 // const char* filename = argc >= 2 ? argv[1] : "lena.jpg"; // 从命令行参数或默认读取 mat src = imread("your_image.jpg", imread_color); // 请替换为您的图片路径 if (src.empty()) { cout << "无法加载图像: " << "your_image.jpg" << endl; return -1; } // 2. 转换为灰度图 mat gray; cvtcolor(src, gray, color_bgr2gray); // 3. (可选)高斯模糊以减少噪声,从而获得更清晰的梯度 mat blurred_gray; gaussianblur(gray, blurred_gray, size(3, 3), 0, 0, border_default); // 接下来我们将对 blurred_gray 或 gray 进行操作
2. sobel 算子
sobel 算子是一种离散的一阶微分算子,用于计算图像亮度函数梯度的近似值。它结合了高斯平滑和微分求导。sobel 算子分别计算水平方向(gx)和垂直方向(gy)的梯度。
cv::sobel
函数原型:
void sobel( inputarray src, outputarray dst, int ddepth, int dx, int dy, int ksize = 3, double scale = 1, double delta = 0, int bordertype = border_default );
src
: 输入图像。dst
: 输出图像,与输入图像大小和通道数相同。ddepth
: 输出图像的深度。由于梯度值可能为负,通常使用cv_16s
或cv_32f
以避免信息丢失。然后通过cv::convertscaleabs
转换为cv_8u
进行显示。dx
: x 方向上的差分阶数 (0 或 1)。dy
: y 方向上的差分阶数 (0 或 1)。ksize
: sobel 核的大小,必须是 1, 3, 5 或 7。scale
: 可选的计算出的导数值的缩放因子。delta
: 可选的增量,在将结果存储到dst
之前添加到结果中。bordertype
: 像素外插方法。
计算 x 和 y 方向的梯度
// ... 接上文 blurred_gray mat grad_x, grad_y; mat abs_grad_x, abs_grad_y; // 计算 x 方向梯度 // ddepth = cv_16s เพื่อหลีกเลี่ยงการตัดค่า (overflow) sobel(blurred_gray, grad_x, cv_16s, 1, 0, 3, 1, 0, border_default); convertscaleabs(grad_x, abs_grad_x); // 转换回 cv_8u 并取绝对值 // 计算 y 方向梯度 sobel(blurred_gray, grad_y, cv_16s, 0, 1, 3, 1, 0, border_default); convertscaleabs(grad_y, abs_grad_y); // 显示 x 和 y 方向的梯度 imshow("sobel x gradient", abs_grad_x); imshow("sobel y gradient", abs_grad_y);
合并梯度
通常,我们将 x 和 y 方向的梯度组合起来得到总的梯度幅值。一个常见的方法是使用 cv::addweighted
:
g = α ⋅ ∣ g x ∣ + β ⋅ ∣ g y ∣ + γ g = \alpha \cdot |g_x| + \beta \cdot |g_y| + \gammag=α⋅∣gx∣+β⋅∣gy∣+γ
或者直接计算幅值 g = g x 2 + g y 2 g = \sqrt{g_x^2 + g_y^2}g=gx2+gy2。cv::addweighted
提供了一种近似方法。
mat grad_combined; // 近似梯度幅值 (权重可以调整,这里简单相加) addweighted(abs_grad_x, 0.5, abs_grad_y, 0.5, 0, grad_combined); imshow("sobel combined gradient", grad_combined);
更精确的幅值计算通常需要 grad_x
和 grad_y
为 cv_32f
类型,然后使用 cv::magnitude
。
mat grad_x_f, grad_y_f; sobel(blurred_gray, grad_x_f, cv_32f, 1, 0, 3); sobel(blurred_gray, grad_y_f, cv_32f, 0, 1, 3); mat magnitude, angle; carttopolar(grad_x_f, grad_y_f, magnitude, angle, true); // angle in degrees mat abs_magnitude; convertscaleabs(magnitude, abs_magnitude); imshow("sobel magnitude precise", abs_magnitude);
3. scharr 算子
scharr 算子是对 sobel 算子在核大小为 3x3 时的一种优化。它具有更好的旋转对称性,因此在某些情况下可以提供比 3x3 sobel 算子更准确的结果。
cv::scharr
函数原型与 cv::sobel
类似,但它没有 ksize
参数,因为 scharr 算子总是使用固定的 3x3 核。当 dx=1, dy=0
或 dx=0, dy=1
时使用。
void scharr( inputarray src, outputarray dst, int ddepth, int dx, int dy, double scale = 1, double delta = 0, int bordertype = border_default );
使用方法与 sobel 类似:
// ... 接上文 blurred_gray mat scharr_grad_x, scharr_grad_y; mat abs_scharr_grad_x, abs_scharr_grad_y; // 计算 x 方向 scharr 梯度 scharr(blurred_gray, scharr_grad_x, cv_16s, 1, 0, 1, 0, border_default); convertscaleabs(scharr_grad_x, abs_scharr_grad_x); // 计算 y 方向 scharr 梯度 scharr(blurred_gray, scharr_grad_y, cv_16s, 0, 1, 1, 0, border_default); convertscaleabs(scharr_grad_y, abs_scharr_grad_y); // 显示 scharr 梯度 imshow("scharr x gradient", abs_scharr_grad_x); imshow("scharr y gradient", abs_scharr_grad_y); mat scharr_grad_combined; addweighted(abs_scharr_grad_x, 0.5, abs_scharr_grad_y, 0.5, 0, scharr_grad_combined); imshow("scharr combined gradient", scharr_grad_combined);
4. laplacian 算子
laplacian (拉普拉斯) 算子是一种二阶微分算子,它计算图像的二阶导数。它可以用来检测边缘,对噪声比较敏感。laplacian 算子通常通过检测图像中的零交叉点来定位边缘。
cv::laplacian
函数原型:
void laplacian( inputarray src, outputarray dst, int ddepth, int ksize = 1, double scale = 1, double delta = 0, int bordertype = border_default );
ksize
: 拉普拉斯核的大小,必须是正奇数。通常是 1 或 3。
// ... 接上文 blurred_gray mat laplacian_dst; mat abs_laplacian_dst; laplacian(blurred_gray, laplacian_dst, cv_16s, 3, 1, 0, border_default); // ksize=3 convertscaleabs(laplacian_dst, abs_laplacian_dst); imshow("laplacian operator", abs_laplacian_dst);
由于拉普拉斯算子是二阶导数,它的结果中正值和负值都有意义(表示亮度的快速变化)。convertscaleabs
将这些值转换为适合显示的 8 位无符号整数。
5. 显示结果与程序结束
在 main
函数的末尾,添加等待按键和关闭窗口的调用:
// ... 所有 imshow 调用之后 cout << "按任意键退出..." << endl; waitkey(0); destroyallwindows(); return 0; }
完整示例代码
#include <opencv2/opencv.hpp> #include <iostream> using namespace cv; using namespace std; int main(int argc, char** argv) { // 1. 加载图像 const char* filename = "your_image.jpg"; // 请替换为您的图片路径 mat src = imread(filename, imread_color); if (src.empty()) { cout << "无法加载图像: " << filename << endl; return -1; } imshow("original image", src); // 2. 转换为灰度图 mat gray; cvtcolor(src, gray, color_bgr2gray); imshow("grayscale image", gray); // 3. (可选)高斯模糊以减少噪声 mat blurred_gray; gaussianblur(gray, blurred_gray, size(3, 3), 0, 0, border_default); imshow("blurred grayscale", blurred_gray); // --- sobel 梯度 --- mat grad_x_sobel, grad_y_sobel; mat abs_grad_x_sobel, abs_grad_y_sobel; mat grad_combined_sobel; sobel(blurred_gray, grad_x_sobel, cv_16s, 1, 0, 3, 1, 0, border_default); convertscaleabs(grad_x_sobel, abs_grad_x_sobel); sobel(blurred_gray, grad_y_sobel, cv_16s, 0, 1, 3, 1, 0, border_default); convertscaleabs(grad_y_sobel, abs_grad_y_sobel); addweighted(abs_grad_x_sobel, 0.5, abs_grad_y_sobel, 0.5, 0, grad_combined_sobel); imshow("sobel x gradient", abs_grad_x_sobel); imshow("sobel y gradient", abs_grad_y_sobel); imshow("sobel combined gradient", grad_combined_sobel); // --- scharr 梯度 --- mat grad_x_scharr, grad_y_scharr; mat abs_grad_x_scharr, abs_grad_y_scharr; mat grad_combined_scharr; scharr(blurred_gray, grad_x_scharr, cv_16s, 1, 0, 1, 0, border_default); convertscaleabs(grad_x_scharr, abs_grad_x_scharr); scharr(blurred_gray, grad_y_scharr, cv_16s, 0, 1, 1, 0, border_default); convertscaleabs(grad_y_scharr, abs_grad_y_scharr); addweighted(abs_grad_x_scharr, 0.5, abs_grad_y_scharr, 0.5, 0, grad_combined_scharr); imshow("scharr x gradient", abs_grad_x_scharr); imshow("scharr y gradient", abs_grad_y_scharr); imshow("scharr combined gradient", grad_combined_scharr); // --- laplacian 梯度 --- mat laplacian_dst; mat abs_laplacian_dst; laplacian(blurred_gray, laplacian_dst, cv_16s, 3, 1, 0, border_default); convertscaleabs(laplacian_dst, abs_laplacian_dst); imshow("laplacian operator", abs_laplacian_dst); cout << "按任意键退出..." << endl; waitkey(0); destroyallwindows(); return 0; }
编译与运行
假设您已正确安装 opencv,可以使用 g++ 编译上述代码:
g++ your_code_file.cpp -o gradient_extraction $(pkg-config --cflags --libs opencv4) ./gradient_extraction your_image.jpg
(如果 pkg-config --libs opencv4
不起作用,请根据您的 opencv 版本和安装方式调整链接器标志,例如 opencv
或特定模块如 opencv_core opencv_imgproc opencv_highgui opencv_imgcodecs
)
总结
图像梯度是图像处理中的重要工具。sobel、scharr 和 laplacian 算子是 opencv 中用于计算梯度的常用方法。
- sobel 是最常用的,提供 x 和 y 方向的梯度。
- scharr 在 3x3 核上通常比 sobel 更精确。
- laplacian 是二阶导数,对噪声敏感,但可以直接给出边缘信息。
选择哪种算子取决于具体的应用需求和图像特性。通常,在计算梯度之前进行高斯模糊可以帮助减少噪声对结果的影响。同时,注意输出图像深度 (ddepth
) 的选择,以避免梯度计算过程中的信息丢失,后续再通过 convertscaleabs
转换到适合显示的 cv_8u
格式。
到此这篇关于c/c++的opencv 进行图像梯度提取的实现的文章就介绍到这了,更多相关opencv 图像梯度提取内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论