互联网爬虫,蜘蛛,数据采集器,网页解析器的汇总,因新技术不断发展,新框架层出不穷,此文会不断更新...javascript
交流讨论
- 欢迎推荐你知道的开源网络爬虫,网页抽取框架.
- 开源网络爬虫QQ交流群:322937592
- email address: liinux at qq.com
Python
Java
C#
JavaScript
PHP
C++
C
R
Erlang
Perl
Go
Scala
- crawler - 基于Scala DSL的网络爬虫.
- scrala - 由Scala开发基于scrapy内核的网络爬虫.
- ferrit - 基于Scala开发使用了Akka, Spray,Cassandra的网络爬虫.