Python网络爬虫入门笔记 八、提取信息

信息的提取有多种方法。   一、完整解析信息的标记形式,再提取关键信息 顾名思义,首先解析信息的标记形式,再提取需要的信息。 这种方法需要标记解析器,例如前面用到的BeautifulSoup库提供的标签树遍历。 优点:信息解析准确 缺点:提取信息繁琐,速度慢,也要求对信息的组织形式有一定的认识和了解。   二、无视标记形式,直接搜索关键信息 对信息的文本查找函数即可。 优点:提取过程简介,速度较快
相关文章
相关标签/搜索