在以前的文章:使用Python爬取天猫店铺联系方式|思路与方法 中咱们介绍了如何使用Python采集天猫店铺的企业联系方式。html
在采集的过程当中,咱们有两个地方须要对图片进行处理,其中一个是验证码:小程序
在这里咱们须要将验证码下载到本地并进行验证码识别。第二个地方则是店铺工商执照的照片:bash
图片是带有天猫的灰色水印的,咱们将图片下载下来:微信
若是这样直接对图片进行ORC文字识别,有可能会致使不能正确识别出公司名称来。咱们须要对水印进行去除。工具
要对普通的图片水印进行去除,咱们能够对图片进行灰度转换,而后再进行二值化转换。可是这样的方法容易形成图片的失真。ui
针对如上图这种配色单一的水印图片,咱们能够直接将水印颜色填充替换为白色,从而实现水印的快速去除。spa
核心代码以下所示:3d
import cv2
import traceback
try:
# 读取图片
img = cv2.imread(filename)
# 获取图片大小
x, y, z = img.shape
for i in range(x):
for j in range(y):
varP = img[i, j]
if sum(varP) == 687:
img[i, j] = [255, 255, 255]
cv2.imwrite('zmister_qushuiyin.jpg', img)
except Exception as e:
print(traceback.print_exc())
复制代码
这样,咱们的图片就能够快速去除天猫的水印:code
上面的代码快速地实现了天猫文字水印的去除,可是做为代码自己就不方便传播和使用。索性借助于PyQt5,咱们将其打包为一个桌面图形界面程序。cdn
这样,一个简单的去水印桌面小程序就写完了。 须要源码的能够关注微信公众号:州的先生,回复关键字去水印源码进行获取。
文章来源:州的先生博客,欢迎分享,转载请保留出处