这个专辑开始从环境的搭建到app数据抓取的整套的实战流程。
咱们会学到什么?
老铁,只有个电脑没有手机怎么办,没事我想到了用模拟器,说实话模拟器没有手机爬的效率快,可是模拟器都会了手机仍是问题不?
模拟点击,模拟输入等功能
-
python编写爬虫app数据
-
基于docker的多app端数据抓取系统
拿到数据能干什么?
对比其余公司的状态,对公司的运营有指导做用。分析用户的行为和消费需求。
精准的定位用户,对用户进行分类。
拿到报表数据,做为指导
经过对手app应用投放的数据,最近在某个城市启动了那么新的产品,某个营销数据和趋势,能够了解对手在某个城市的运营情况,从而相对的应对。
对于本身的好处
web端的抓取思路不少,github一堆一堆的。可是app抓取应用数据的技能不多。
-
如何抓取App应用的数据?
-
抓取过哪些应用上的数据?
-
抓包工具如何使用?
App的数据好抓吗?
既简单又困难
app里的数据比web端更容易抓取,反爬能力也没那么强。大部分都是http或者https协议,返回的数据类型大多数为json。直接解析json就能够了。
-
可能须要适当的反编译,解析出来加密算法并抓取信息
-
可能加固了,须要脱壳,而后反编译,分析出加密算法并抓取信息
-
须要破解经过各式各样的证书,签名,设备绑定等方法,找到隐藏加密算法
python爬虫工程师须要的技能点
-
python爬虫开发经验
-
java开发经验
-
android开发经验
-
app 逆向
-
app 脱壳
-
破解加密算法
最终目的
python自动化应用,抓包工具,解析app应用的方法来进行数据的抓取。不须要破解加密算法。
PS:以前也学过一段时间python,爬过一些数据和app,公司目前还停留在手动点击的测试里,同事也催我帮忙写套教程,最好是围绕docker的完成python的自动化测试,使用app测试工具appium。就开始行动了。里面但是有不少的灰色技术,潮流技术,多工具对比,哈哈。但愿老铁能够get到!