使用 Sobel 算子理解梯度组合策略输出

问题描述 投票:0回答:1

我尝试实现 Sobel Edge 检测器,如下所示:

def sobel(img):
    img = cv2.GaussianBlur(img, (5, 5), 0)
    
    filter_x = np.array([
        [-1, 0, 1],
        [-2, 0, 2],
        [-1, 0, 1]
    ])
    
    filter_y = np.array([
        [-1, -2, -1],
        [0, 0, 0],
        [1, 2, 1]
    ])
    
    S_x = cv2.filter2D(img, -1, filter_x)
    S_y = cv2.filter2D(img, -1, filter_y)
    
#     S_x = cv2.convertScaleAbs(S_x)
#     S_y = cv2.convertScaleAbs(S_y)
#     grad = S_x * 0.5 + S_y * 0.5
    grad = np.sqrt(S_x ** 2 + S_y ** 2)
    grad = np.clip(grad, 0, 255)
    return grad.astype(np.uint8)

img_gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
plt.figure(figsize=(10, 10))
edge = sobel(img_gray)
plt.imshow(edge, cmap='gray')

我得到的输出非常嘈杂。例如: Sobel output (L2)

发生这种情况是因为我正在计算 x 和 y 方向上梯度的 L2 幅度。然而,当我将策略切换为使用 L1 规范(即使用 `S_x * 0.5 + S_y * 0.5)时,我得到的输出噪音要小得多:

Sobel output (L1)

为什么会发生这种情况?根据各种消息来源,这两种组合都被使用,但我想了解为什么 L2 变体如此嘈杂,以及如何避免它。

谢谢!

python numpy opencv image-processing
1个回答
0
投票

cv2.filter2D
产生与输入类型相同的输出。如果输入是 uint8,那么 Sobel 滤波器将上溢和下溢(负值将显示为大的正值)。

在过滤之前将输入图像转换为float类型。

© www.soinside.com 2019 - 2024. All rights reserved.