scrapy 入门爬取新闻

为文本分类实验爬取数据集,要求一百万,分类>10类。html

参考连接:http://litianyi.cc/technology/2015/12/01/text-classification-1/scrapy

文档:https://scrapy-chs.readthedocs.io/zh_CN/0.24/intro/tutorial.htmlhtm

最基础的爬取,实验新浪科技大概3k+,腾讯科技5k+,一财5w+,就爬不动了。文档

相关文章
相关标签/搜索