在诸多的网站中作爬虫,有很是多的源码是通过js加密处理,通用的方法就是分析js的加密过程,而后用python模拟加密,最后获得本身想要的数据。node
例如 案例里面的有道翻译python
经过抓包分析发现,js加密的sign数据能够使用一下方式生成linux
In [6]: from hashlib import md5 In [7]: s = md5() In [8]: s.update("123456".encode()) In [9]: s.hexdigest() Out[9]: 'e10adc3949ba59abbe56e057f20f883e'
该库能够运行JavaScript的代码,极大的简化了python实现js加密的过程windows
linux函数
pip install pyexecjs
# 第三方库网站
sudo apt-get install nodejs
# JavaScript的运行环境加密
windows翻译
pip install pyexecjs
code
In [1]: import execjs In [2]: js = "'red yellow green blue'.split(' ')" In [3]: print(execjs.eval(js)) ['red', 'yellow', 'green', 'blue']
在爬虫中遇到的不少都是封装好的函数,因此在python中执行一下JavaScript函数ip
import execjs js = """ function fun1(a, b) { s = a * b; return s } """ ctx = execjs.compile(js) result = ctx.call("fun1", 2, 3) print(result)