知识点讲解五:处理js异步加载问题

文章目录 前言 环境 代码思路 原代码 前言 在新闻网站中大多采用的是异步加载模式,新闻条目会随滚动条的滚动而逐渐加载。当爬虫访问这类网站时获得的HTML数据仅仅是咱们看到的页面数据,只有当咱们向下滚动时,网页的源代码才会同步更新。例如:腾讯新闻,处理这类JS异步加载的问题,这里用selenium来解决。python 环境 Python 3.6.5 须要安装的包:selenium 编译器:subl
相关文章
相关标签/搜索