素描做为一种近乎完美的表现手法有其独特的魅力,随着数字技术的发展,素描早已再也不是专业绘画师的专利,今天这篇文章就来说一讲如何使用python批量获取小姐姐素描画像。文章共分两部分:css
第一部分介绍两种使用python生成素描画的思路html
第二部分介绍如何批量获取素描画python
本部分介绍的两个思路都是基于opencv来实现,不涉及深度学习相关内容。基本思想是读入一张照片图,而后经过各类变换转化成素描图。为了演示方便,咱们先找来一张小姐姐的照片做为实验素材。程序员
一、漫画风格正则表达式
先来讲第一种方法,这种方法的核心思想是利用了名为“阈值化”的技术,这种技术是基于图像中物体与背景之间的灰度差别,而进行的像素级别的分割。算法
若是想要把一张图片转化为只呈现黑色和白色的素描图,就须要对其进行二值化操做,opencv中提供了两种二值化操做方法:threshold()和adaptiveThreshold()。相比threshold(),adaptiveThreshold()可以根据图像不一样区域亮度分布进行局部自动调节,所以被称为自适应二值化。下面这幅图就是对彩色图片进行二值化操做后的效果。ide
上面提到的概念可能比较晦涩,不理解也没有关系,下面咱们重点讲讲怎么进行实际操做。函数
第一步,读入图片并转化为灰度图。这一步算是常规操做了,相信使用过opencv的同窗都写过相似的代码。学习
img_rgb = cv2.imread(src_image) img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_RGB2GRAY)
第二步,使用adaptiveThreshold()方法对图片进行二值化操做,函数中的参数大多用于设置自适应二值化的算法和阈值等。网站
img_edge = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, blockSize=3, C=2)
第三步,保存转换后的图片
cv2.imwrite(dst_image, img_edge)
通过上述步骤的操做,咱们获得了一幅新的黑白图片,一块儿来看看转换后的图片效果。
从转换后的图片来看,虽然大概轮廓没有问题,可是效果很不理想,并不可以称之为素描图。这主要是由于adaptiveThreshold()会在图片的每个小的局部区域内进行二值化操做,所以对于一些清晰度比较高、色彩区分比较细腻的图片,就会出现上面这样密密麻麻的状况。
这个问题解决起来其实也很简单,只要在进行二值化以前加入下面这行代码对原图进行模糊化就能够了。
img_gray = cv2.medianBlur(img_gray, 5)
再来看看此次生成的素描图(下图),是否是看起来舒服多了,还有一种手绘漫画的感受。
二、写实风格
经过上面这种方法,虽然最终也得到了一幅还算不错的素描图,可是看起来多少有些“失真”,为了获取看起来更加真实的素描图,咱们尝试另一种方法。
这种方法的核心思想是经过“底片融合”的方式获取原图中一些比较重要的线条,具体实现步骤以下:
第一步,跟上面的方法同样,使用opencv读取图片并生成灰度图。
第二步,对灰度图进行模糊化操做。通过试验,使用上面提到的中值滤波函数cv2.medianBlur()进行模糊化操做最终获得的素描图效果并很差,这里咱们尝试使用高斯滤波进行图片模糊化,代码以下:
img_blur = cv2.GaussianBlur(img_gray, ksize=(21, 21), sigmaX=0, sigmaY=0)
其中,参数ksize表示高斯核的大小,sigmaX和sigmaY分别表示高斯核在 X 和 Y 方向上的标准差。
第三步,使用cv2.divide()方法对原图和模糊图像进行融合,cv2.divide()本质上进行的是两幅图像素级别的除法操做,其获得的结果能够简单理解为两幅图之间有明显差别的部分。来看代码:
cv2.divide(img_gray, img_blur, scale=255)
第四步,保存生成的图片,代码跟上一个方法中同样,咱们直接来看获取到的素描图效果。
从结果来看,这种方法得到的素描图线条更加细腻,素描效果也更好。
在这一部分,咱们要实现批量获取小姐姐素描画像的功能,基于上文中两种素描图效果比对,这里采用第二种方法来实现图片到素描图的转换。
那么,接下来要解决的就是图片源的问题了。最近不少项目都成功实现了从抖音或者知乎获取漂亮小姐姐这一操做,其实除了这些平台以外还有好多网站能获取到漂亮小姐姐的图片。
网站的具体内容我就不在文中展现了,为了指定图片爬取的思路,大概讲下页面结构:网站的主页罗列了N个主题,每一个主题页面中都包含了M张小姐姐的图片,结构示意图以下:
各页面url的构建也很明了,例以下图中的页面url是http://www.waxjj.cn/2794.html,其中2794就是主题页的ID号。查看页面的html代码(下图),发现每张图片都在一个<li>
标签下面。
遇到这种状况,通常来讲咱们能够经过某种解析器来获取每张图片的url。可是,通过仔细观察发现整个网页的html代码中只有涉及图片url的部分带有完整的http链接,所以能够考虑使用正则表达式来提取图片url,实现这部分功能的代码以下。
在上面这段代码中,咱们提取主题页的ID做为待保存图片名称的一部分,save_jpg()函数中会把每张图片转换为素描图并保存到本地。
因为咱们要使用opencv对抓取到的图片进行各类运算转换,所以使用requests获取的图片必须先保存到本地,再用opencv从新读入后才行。基于上述思想,咱们构建了以下所示的save_jpg()函数,其中rgb_to_sketch()函数是对上文第一部分中所说的第二种素描图的获取方法进行的封装。
而在主函数中,咱们只须要指定想要获取主题页面的id号,构建一组url列表就能够了:
def main(): idlist = ['id1', 'id2'] urllist = ['http://www.waxjj.cn/'+x+'.html' for x in idlist] jpgurls = get_jpg_urls(urllist)
以上就是完整代码,在学习Python的过程当中,每每由于没有资料或者没人指导从而致使本身不想学下去了,所以我特地准备了个群 592539176 ,群里有大量的PDF书籍、教程都给你们无偿使用!不论是学习到哪一个阶段的小伙伴均可以获取到本身相对应的资料!来看看运行后的效果吧~~
其实程序员要想防止脱发,我以为仍是要多锻炼身体,少熬夜,固然多看看养眼的小姐姐也不是不错的!
你说呢