如今在百度上面搜索一个关键词,最前面的几个搜索结果都是广告,好比你搜索一个Python,前面几个都是百度竞价的Python培训机构。ide
既然是净化,广告什么的固然要统统剔除啦。。。网站
Python版本:3.5.43d
相关模块:code
requests模块、bs4模块、win_unicode_console模块、PyQt5模块以及一些Python自带的模块。cdn
环境搭建视频
安装Python并添加到环境变量,pip安装须要的相关模块便可。blog
利用Python处理百度搜索关键字后返回的页面,提取其中的有效信息。教程
(1)直接运行ip
功能:unicode
在cmd窗口运行BaiduSearch_Spider.py文件后,根据提示输入相关信息后将获得的有效信息保存到results.txt文件中。
若需其余功能请自行修改源代码。
运行示例以下图所示:
结果:
(2)做为模块导入
使用示例以下图所示:
运行以及结果图:
返回的数据格式为:
简单实例:
功能:
(1)在cmd窗口中运行并展现得到的有效信息;
(2)根据有效信息选择想要了解的连接后将该连接网站在PyQt制做的简易Demo中显示。
结果图:
细心的小伙伴可能会发现:
这里不支持播放这种视频,由于我没配置,官网有配置教程,全英文实在懒得看,若是须要深刻了解的小伙伴能够本身去看一下文档。