很是适合新手的一个Python爬虫项目: 打造一个英文词汇量测试脚本!

最近朋友在苦学英文,可是又不知道本身学的怎么样了,直到有一天,他找到了扇贝网,里面有个“评估你的单词量”功能很是的好,就推荐给我了!python


 

今天咱们就用python作一个小的爬虫,而后本身写一个脚原本实现这个功能吧!json

目标:打造一个英文词汇量测试脚本工具

url:扇贝网学习

工具:python3.六、pycharm、requests库测试

思路:网站

和网页同样,总共分三步:url


 

先来看看网页中数据,用F12开发者工具抓包就能够blog

为了更好的演示,这里网页缩小了。开发


 

点击开始,在来看看出现了什么pycharm


 

这里咱们抓到了一个包,这个json数据中包含了全部的类别或者说是级别,一共十大类,咱们点击”响应”验证下


 能够看到,显示内容在咱们抓到的json数据中,可是0和1中的内容有的同样,有的不同是什么鬼?不要急,咱们先选择‘高考’,在抓下包看看

 选择高考后,网页直接给出了第二步,50个单词选择,注意,先看下抓到的json数据的真实地址

 还记得咱们在第一步抓到的包吗?0里面就是这个真实地址最后的category的值,1里面是对应的显示在网页中的内容,好了,第二步的真实url也被咱们找到规律了,那下来就是分析单词了,看看有什么规律,咱们点开一个看看

 有几个值很是重要,也是咱们的目标:

Content的值是显示的单词

Definition_choices是须要咱们判断的多个词义,中间包含有正确的词义,每一个词义中的rank值应该是该词义的标识

rank值是正确的词义,也由此判断上述多个词义中的正确词义

ok,到这里咱们就能够开始写代码了,具体过程就不一一说明了,没有反爬,所有是json数据的读取和判断,先放上个人代码和运行效果


 python学习交流群542110741

请你们忽略我那渣渣的英语水平和排版


 

因为这个网站很是简单,仅仅抓包就能够获得全部数据,没有任何反爬,因此,也是咱们新手练手的好地方,你们均可以试试,若是有做出更漂亮的脚本,欢迎你们在评论区一块儿分享!

相关文章
相关标签/搜索