爬虫练手——使用Beautiful Soup、XPath分别获取丁香园论坛回复内容

简单整点吧 简单的说,Beautiful Soup就是Python的一个html或xml的解析库,可以用来从网页中提取数据。 BeautifulSoup在解析时实际上以来解析器,它除了支持Python标准库中的html解析器外,还支持一些第三方解析器(比如lxml)。用法介绍就看文档和一些书籍就好了,推荐崔庆才的《 Python3网络爬虫开发实战》。 再说说XPath,全称是XML Path La
相关文章
相关标签/搜索