爬虫练手——使用Beautiful Soup、XPath分别获取丁香园论坛回复内容

时间 2021-01-12

原文原文链接

简单整点吧简单的说，Beautiful Soup就是Python的一个html或xml的解析库，可以用来从网页中提取数据。 BeautifulSoup在解析时实际上以来解析器，它除了支持Python标准库中的html解析器外，还支持一些第三方解析器（比如lxml）。用法介绍就看文档和一些书籍就好了，推荐崔庆才的《 Python3网络爬虫开发实战》。再说说XPath，全称是XML Path La