Python爬虫进阶必备 | XX文书网加密分析-20190902版

XX文书网20190902版

此次分享的是XX文书网于2019年09月02日的加密算法。javascript

目前该网站已经更换了加密算法,主要缘由是原算法太简单,9月2日更新的算法9月3日访问网站已经感受到明显卡顿,防御并非很到位。java

分析后发现0902版加密较上一个版本还要弱上一个等级,连站长的sojson.v5都没上。python

如今来看是这个版本是为上新的瑞数混淆算法作铺垫。web

最后的狂欢???
算法

目前该网站采用的瑞数动态混淆的加密算法,反混淆难度高,解密难度高json

接下来讲说0902版的加密,如下仅为参考:微信

__RequestVerificationToken

搜索关键词__RequestVerificationToken 【图1-1】app

图1-1

找到base.random(24)这个方法,这个复制出来就解决了。dom

function get_random(size){
    var str = "",
        arr = ['0''1''2''3''4''5''6''7''8''9''a''b''c''d''e''f''g''h''i''j''k''l''m''n''o''p''q''r''s''t''u''v''w''x''y''z''A''B''C''D''E''F''G''H''I''J''K''L''M''N''O''P''Q''R''S''T''U''V''W''X''Y''Z'];
    for(var i=0; i<size; i++){
        str += arr[Math.round(Math.random() * (arr.length-1))];
    }
    return str;
}

Ciphertext

经过XHR断点,查看堆栈信息【图2-1】测试

图2-1

加密位置为【图2-2】

图2-2

直接扣取ciphertext这个方法的代码便可,这里展现部分代码:

cipher=function(){
    var date = new  Date();
    var timestamp = date.getTime().toString();
    var salt =get_random(24);
    var year=date.getFullYear().toString();
    var month = (date.getMonth()+1<10 ? "0"+(date.getMonth()+1) : date.getMonth()).toString();
    var day = (date.getDate()<10 ? "0"+date.getDate() : date.getDate()).toString();
    var iv =year+month+day;
    var enc = DES3.encrypt(timestamp,salt,iv).toString();
    var str = salt+iv+enc;
    var ciphertext = strTobinary(str);
    return ciphertext;
}

pageld

这个参数在首页点击时自动带入,通过测试并非必须项,能够经过分析首页的源码查看到调用的方法。

function get_uuid(){
    var guid = "";
    for (var i = 1; i <= 32; i++) {
        var n = Math.floor(Math.random() * 16.0).toString(16);
        guid += n;
        // if ((i == 8) || (i == 12) || (i == 16) || (i == 20)) guid +=
        // "-";
    }
    return guid;
}

且爬且珍惜,你们都是要吃饭的啊

本文分享自微信公众号 - 咸鱼学Python(xianyuxuepython)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索