正则表达式(五)-网页爬虫

网络爬虫:(蜘蛛) 所谓的网络爬虫就是一段小程序,从网络中把特定的字段爬取下来 你比如说爬邮箱地址.先把整个网页的所有的程序都下载下来放在一个str中.然后按照邮箱的正则表达式规则,对这个str进行提取.将所有的邮箱地址都提取出来 开发过程: 要想进行信息的爬虫,你首先得有数据源啊.图1,所示,就是毕老师使用的数据源 方法1,已经把网页中的内容存到文件中了 package zhengze; imp
相关文章
相关标签/搜索