所以,我使用 opencv 捕获文档,扫描并裁剪它。当房间里没有照明时,它工作得很好。当房间里有一些光线,并且桌子上有眩光并且文档靠近它时,它也会将眩光捕获为矩形的一部分。
如何去除照片中的眩光?
这是我用来获取我想要的图像的代码:
Mat &image = *(Mat *) matAddrRgba;
Rect bounding_rect;
Mat thr(image.rows, image.cols, CV_8UC1);
cvtColor(image, thr, CV_BGR2GRAY); //Convert to gray
threshold(thr, thr, 150, 255, THRESH_BINARY + THRESH_OTSU); //Threshold the gray
vector<vector<Point> > contours; // Vector for storing contour
vector<Vec4i> hierarchy;
findContours(thr, contours, hierarchy, CV_RETR_CCOMP,
CV_CHAIN_APPROX_SIMPLE); // Find the contours in the image
sort(contours.begin(), contours.end(),
compareContourAreas); //Store the index of largest contour
bounding_rect = boundingRect(contours[0]);
rectangle(image, bounding_rect, Scalar(250, 250, 250), 5);
这是我正在谈论的眩光照片:
我发现的是使用 inRange,找到适当的颜色标量,然后进行修复以消除光线。这是一个代码片段,但它总是崩溃,说它需要带通道的 8 位图像。
Mat &image = *(Mat *) matAddrRgba;
Mat hsv, newImage, inpaintMask;
cv::Mat lower_red_hue_range;
inpaintMask = Mat::zeros(image.size(), CV_8U);
cvtColor(image, hsv, COLOR_BGR2HSV);
cv::inRange(hsv, cv::Scalar(0, 0, 215, 0), cv::Scalar(180, 255, 255, 0),
lower_red_hue_range);
image = lower_red_hue_range;
inpaint(image, lower_red_hue_range, newImage, 3, INPAINT_TELEA);
我以前处理过这个问题,光照的变化一直是计算机视觉检测和描述图像的一个问题。我实际上训练了一个分类器,用于 HSV 颜色空间而不是 RGB/BGR,它将具有变化的入射光的图像映射到没有突然的亮度/暗块的图像(这将是标签)。这对我来说非常有效,但是,图像总是具有相同的背景(我不知道你是否也有这个)。
当然,机器学习可以解决这个问题,但可能有点矫枉过正。当我进行上述操作时,我遇到了 CLAHE,它对于局部对比度增强非常有效。我建议您在检测轮廓之前尝试一下。此外,您可能希望使用不同的色彩空间,例如 HSV/Lab/Luv,而不是用于此目的的 RGB/BGR。您可以将 CLAHE 单独应用于每个通道,然后将它们合并。
如果您需要其他信息,请告诉我。我在 python 中用你的图像实现了这个,它工作得很好,但我会把编码留给你。我可能会在几天后更新我得到的结果(希望你先得到它们;))。希望有帮助。
opencv-python 助手
import cv2
import numpy as np
import time
clahefilter = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(16,16))
img = cv2.imread('spects_glare.jpg')
while True:
t1 = time.time()
img = img.copy()
## crop if required
#FACE
x,y,h,w = 550,250,400,300
# img = img[y:y+h, x:x+w]
#NORMAL
# convert to gray
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
grayimg = gray
GLARE_MIN = np.array([0, 0, 50],np.uint8)
GLARE_MAX = np.array([0, 0, 225],np.uint8)
hsv_img = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
#HSV
frame_threshed = cv2.inRange(hsv_img, GLARE_MIN, GLARE_MAX)
#INPAINT
mask1 = cv2.threshold(grayimg , 220, 255, cv2.THRESH_BINARY)[1]
result1 = cv2.inpaint(img, mask1, 0.1, cv2.INPAINT_TELEA)
#CLAHE
claheCorrecttedFrame = clahefilter.apply(grayimg)
#COLOR
lab = cv2.cvtColor(img, cv2.COLOR_BGR2LAB)
lab_planes = cv2.split(lab)
clahe = cv2.createCLAHE(clipLimit=2.0,tileGridSize=(8,8))
lab_planes[0] = clahe.apply(lab_planes[0])
lab = cv2.merge(lab_planes)
clahe_bgr = cv2.cvtColor(lab, cv2.COLOR_LAB2BGR)
#INPAINT + HSV
result = cv2.inpaint(img, frame_threshed, 0.1, cv2.INPAINT_TELEA)
#INPAINT + CLAHE
grayimg1 = cv2.cvtColor(clahe_bgr, cv2.COLOR_BGR2GRAY)
mask2 = cv2.threshold(grayimg1 , 220, 255, cv2.THRESH_BINARY)[1]
result2 = cv2.inpaint(img, mask2, 0.1, cv2.INPAINT_TELEA)
#HSV+ INPAINT + CLAHE
lab1 = cv2.cvtColor(result, cv2.COLOR_BGR2LAB)
lab_planes1 = cv2.split(lab1)
clahe1 = cv2.createCLAHE(clipLimit=2.0,tileGridSize=(8,8))
lab_planes1[0] = clahe1.apply(lab_planes1[0])
lab1 = cv2.merge(lab_planes1)
clahe_bgr1 = cv2.cvtColor(lab1, cv2.COLOR_LAB2BGR)
# fps = 1./(time.time()-t1)
# cv2.putText(clahe_bgr1 , "FPS: {:.2f}".format(fps), (10, 180), cv2.FONT_HERSHEY_SIMPLEX, 0.35, (0, 0, 255))
# display it
cv2.imshow("IMAGE", img)
cv2.imshow("GRAY", gray)
cv2.imshow("HSV", frame_threshed)
cv2.imshow("CLAHE", clahe_bgr)
cv2.imshow("LAB", lab)
cv2.imshow("HSV + INPAINT", result)
cv2.imshow("INPAINT", result1)
cv2.imshow("CLAHE + INPAINT", result2)
cv2.imshow("HSV + INPAINT + CLAHE ", clahe_bgr1)
# Break with esc key
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cv2.destroyAllWindows()