python网络爬虫实战1——基础篇

一、意义       很多数据并没有存在自家的数据库中,在大数据时代,很多的数据都放在网络上,以网页的形式呈现给大家。我们如何将这些没有固定格式的非结构化数据批量从网络上拷贝下来,并提供给后来者进行数据价值的挖掘,是一件非常有意义的事情。这里,我们必须借助ETL(extract,transformation,loading)三个方法将这些数据转化成结构化数据取用。     网络上有许多网页咨询,如
相关文章
相关标签/搜索