python爬虫相关整理

 初级爬虫工程师: Web前端的知识:HTML, CSS, JavaScript, DOM, DHTML, Ajax, jQuery,json等; 正则表达式,能提取正常一般网页中想要的信息,比如某些特殊的文字,链接信息,知道什么是懒惰,什么是贪婪型的正则; 会使用re, BeautifulSoup,XPath等获取一些DOM结构中的节点信息; 知道什么是深度优先,广度优先的抓取算法,及实践中的使
相关文章
相关标签/搜索