我尝试实现 Sobel Edge 检测器,如下所示:
def sobel(img):
img = cv2.GaussianBlur(img, (5, 5), 0)
filter_x = np.array([
[-1, 0, 1],
[-2, 0, 2],
[-1, 0, 1]
])
filter_y = np.array([
[-1, -2, -1],
[0, 0, 0],
[1, 2, 1]
])
S_x = cv2.filter2D(img, -1, filter_x)
S_y = cv2.filter2D(img, -1, filter_y)
# S_x = cv2.convertScaleAbs(S_x)
# S_y = cv2.convertScaleAbs(S_y)
# grad = S_x * 0.5 + S_y * 0.5
grad = np.sqrt(S_x ** 2 + S_y ** 2)
grad = np.clip(grad, 0, 255)
return grad.astype(np.uint8)
img_gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
plt.figure(figsize=(10, 10))
edge = sobel(img_gray)
plt.imshow(edge, cmap='gray')
发生这种情况是因为我正在计算 x 和 y 方向上梯度的 L2 幅度。然而,当我将策略切换为使用 L1 规范(即使用 `S_x * 0.5 + S_y * 0.5)时,我得到的输出噪音要小得多:
为什么会发生这种情况?根据各种消息来源,这两种组合都被使用,但我想了解为什么 L2 变体如此嘈杂,以及如何避免它。
谢谢!
cv2.filter2D
产生与输入类型相同的输出。如果输入是 uint8,那么 Sobel 滤波器将上溢和下溢(负值将显示为大的正值)。
在过滤之前将输入图像转换为float类型。