前言html
只做为学习参考ide
不做为投资参考,不然后果自行承担!!!学习
文件获取spa
关注公众号“木下学Python”,回复关键字“每天基金网”获取源代码。htm
需求blog
“每天基金网”的混合基金的参考数据
图片
http://fund.eastmoney.com/daogou/#dt0;fthh;rs;sd;ed;pr;cp;rt;tp;rk;se;nx;sc3n;stdesc;pi1;pn20;zfdiy;shlistit
获取每支基金的代码,基金名,收费率,管理公司,经理上任时间,基金成立时间,基金规模,以及公司排名自动化
保存到 csv 文件,便于直接对比ast
若是是手工操做的话,那得翻几个网页而且手动复制粘贴到 csv,效率低下,且准确率得不到保障
爬虫这时候就能够大显神威了,所有自动化,不到 10 秒,准确得已保障
公司排名
http://fund.eastmoney.com/company/default.html
从这个网页中提取排名序号,公司名,管理规模,保存到 csv
代码,基金名,收费率
http://fund.eastmoney.com/daogou/#dt0;fthh;rs;sd;ed;pr;cp;rt;tp;rk;se;nx;sc3n;stdesc;pi1;pn20;zfdiy;shlist
今后网页中提取基金代码,基金名,手续费总共有 4 页
每支基金详情
http://fund.eastmoney.com/基金代码.html
从上面得到的基金代码,访问每一支基金详情信息,从中提取成立时间,基金规模,经理连接,管理公司连接
经理上任时间
从获取的经理连接,访问,得到经理上任时间
管理公司
从获取的管理人连接,获取管理这支基金的公司名
结果展现
final
不知道有多少人耐心看到这里啦
从上面步骤每次得到一致基金的数据须要访问 5 个网页
若是熟悉基金的小伙伴们应该知道想对比 10 支基金的话,要手动重复上述步骤 10 次,并复制到 csv,不免有错,还用很多时间
这个爬虫的优点在于,所有自动化,快速,下次可重复使用,能够省时省力
最后,这个不能做为投资参考指标哈,只是用来做为示例的
对于有帮助的的朋友能够点个赞噢