利用 rpc 获取 boss __zp_stoken__

发布时间 2023-03-30 16:06:59作者: 守护式等待

1 什么是 RPC

RPC,英文 RangPaCong,中文让爬虫,旨在为爬虫开路,秒杀一切,让爬虫畅通无阻!

开个玩笑,实际上 RPC 为远程过程调用,全称 Remote Procedure Call,是一种技术思想而非一种规范或协议。RPC 的诞生事实上离不开分布式的发展,RPC 主要解决了两个问题:

  1. 解决了分布式系统中,服务之间的互相调用问题;
  2. RPC 使得在远程调用时,像本地调用一样方便,让调用者感知不到远程调用的逻辑。

RPC 的存在让构建分布式系统更加容易,相比于 HTTP 协议,RPC 采用二进制字节码传输,因此也更加高效、安全。在一个典型 RPC 的使用场景中,包含了服务发现、负载、容错、网络传输、序列化等组件,完整 RPC 架构图如下图所示:

 

 

2 JSRPC

RPC 技术是非常复杂的,对于我们搞爬虫、逆向的来说,不需要完全了解,只需要知道这项技术如何在逆向中应用就行了。

RPC 在逆向中,简单来说就是将本地和浏览器,看做是服务端和客户端,二者之间通过 WebSocket 协议进行 RPC 通信,在浏览器中将加密函数暴露出来,在本地直接调用浏览器中对应的加密函数,从而得到加密结果,不必去在意函数具体的执行逻辑,也省去了扣代码、补环境等操作,可以省去大量的逆向调试时间。我们以某团网页端的登录为例来演示 RPC 在逆向中的具体使用方法。(假设你已经有一定逆向基础,了解 WebSocket 协议,纯小白可以先看看K哥以前的文章)

  • 主页(base64):https://www.zhipin.com/web/geek/job?query=%E7%88%AC%E8%99%AB&city=101210100
  • 参数:r = (new e).z(t, parseInt(n) + 60 * (480 + (new Date).getTimezoneOffset()) * 1e3)

3 首先在本地编写服务端代码,使其能够一直输入t和n,返回计算出来的token

import asyncio
import re
import time
from urllib.parse import unquote, quote

import requests
import urllib3
import websockets

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
headers = {
    'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
    'accept-encoding': 'gzip, deflate, br',
    'accept-language': 'zh-CN,zh;q=0.9',
    'referer': 'https://www.zhipin.com/c101210100-p100101/',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4123.0 Safari/537.36'
}

session = requests.session()
session.headers = headers

headers1 = headers.copy()
params = {
    'page': '2',
    'ka': 'page-2',
}


async def receive_massage(websocket):
    while True:
        try:
            proxies = {}
            session.headers = headers1
            res = session.get(url='https://www.zhipin.com/job_detail/?query=java&city=101210100&industry=&position=100101',
                              timeout=20, proxies=proxies)
            res.encoding = 'utf-8'
            seed, ts = re.findall('seed=(.*?)&name.*?&ts=(.*?)&callbackUrl', res.url)[0]
            print('seed:%s,ts:%s' % (unquote(seed), ts))
            print(unquote(seed), ts)

            send_text = "{}-{}".format(unquote(seed), ts)

            await websocket.send(send_text)
            response_text = await websocket.recv()
            print("\n加密结果:", response_text)
            new_cookie = 'Hm_lvt_194df3105ad7148dcf2b98a91b5e727a=%s; Hm_lpvt_194df3105ad7148dcf2b98a91b5e727a=%s; __zp_stoken__=%s' % (
                int(ts) // 1000, int(ts) // 1000, quote(response_text))
            headers['cookie'] = new_cookie
            session.headers = headers
            res = session.get(url='https://www.zhipin.com/job_detail/?query=java&city=101210100&industry=&position=100101',
                              timeout=20, proxies=proxies)
            res.encoding = 'utf-8'
            if 'BOSS直聘' not in res.text:
                print('失败一次')
            else:
                print('成功!!')
            time.sleep(3)
        except Exception as e:
            print(e)


start_server = websockets.serve(receive_massage, '0.0.0.0', 5698)  # 创建socket服务  绑定5698端口
asyncio.get_event_loop().run_until_complete(start_server)
asyncio.get_event_loop().run_forever()






# 简单起服务
import asyncio
import sys

import websockets


async def receive_massage(websocket):
    while True:
        send_text = input("请输入要加密的字符串: ")
        if send_text == "exit":
            print("Exit, goodbye!")
            await websocket.send(send_text)
            await websocket.close()
            sys.exit()
        else:
            await websocket.send(send_text)
            response_text = await websocket.recv()
            print("\n加密结果:", response_text)


start_server = websockets.serve(receive_massage, '0.0.0.0', 5698)  # 创建socket服务  绑定5698端口
asyncio.get_event_loop().run_until_complete(start_server)
asyncio.get_event_loop().run_forever()

4 编写浏览器客户端 JS 代码,收到消息就直接

window.abc = e;    //把加密函数保存为全局变量  后面可以使用
const ws = new WebSocket("ws://127.0.0.1:5698");   // 链接创建的socket服务
ws.onmessage = function (evt) {
    console.log("Received Message: " + evt.data);   // 打印服务器发送过来的值
    if (evt.data == "exit") {
        ws.close();
    } else {
        debugger;
        let arr = evt.data.split('-');  // 到传过来的函数分割
        let toke = (new window.abc).z(arr[0], parseInt(arr[1]) + 60 * (480 + (new Date).getTimezoneOffset()) * 1e3);    // 计算出加密值
        console.log(toke);
        ws.send(toke);   // 返回加密后的值
    }
};

5 Sekiro

通过前面的示例,可以发现自己写服务端太麻烦了,不易扩展,那这方面有没有现成的轮子呢?答案是有的,这里介绍两个项目:

 

JsRPC-hliang 是用 go 语言写的,是专门为 JS 逆向做的项目,而 Sekiro 功能更加强大,Sekiro 是由邓维佳大佬,俗称渣总,写的一个基于长链接和代码注入的 Android Private API 暴露框架,可以用在 APP 逆向、APP 数据抓取、Android 群控等场景,同时 Sekiro 也是目前公开方案唯一稳定的 JSRPC 框架,两者在 JS 逆向方面的使用方法其实都差不多,本文主要介绍一下 Sekiro 在 Web JS 逆向中的应用。

参考 Sekiro 文档,首先在本地编译项目:

  • Linux & Mac:执行脚本 build_demo_server.sh,之后得到产出发布压缩包:sekiro-service-demo/target/sekiro-release-demo.zip
  • Windows:可以直接下载:https://oss.virjar.com/sekiro/sekiro-demo

然后在本地运行(需要有 Java 环境,自行配置):

  • Linux & Mac:bin/sekiro.sh
  • Windows:bin/sekiro.bat

以 Windows 为例,启动后如下:

 

 

 接下来就需要在浏览器里注入代码了,需要将作者提供的 sekiro_web_client.js(下载地址:https://sekiro.virjar.com/sekiro-doc/assets/sekiro_web_client.js) 注入到浏览器环境,然后通过 SekiroClient 和 Sekiro 服务器通信,即可直接 RPC 调用浏览器内部方法,官方提供的 SekiroClient 代码样例如下:

function guid() {
    function S4() {
        return (((1 + Math.random()) * 0x10000) | 0).toString(16).substring(1);
    }

    return (S4() + S4() + "-" + S4() + "-" + S4() + "-" + S4() + "-" + S4() + S4() + S4());
}

var client = new SekiroClient("ws://127.0.0.1:5612/business-demo/register?group=rpc-test&clientId=" + guid());

client.registerAction("getToken", function (request, resolve, reject) {
    t = request["t"];
    n = request["n"];
    let toke = (new window.abc).z(t, parseInt(n) + 60 * (480 + (new Date).getTimezoneOffset()) * 1e3);
    console.log(toke);
    resolve(toke);
})

wss 链接里,如果是免费版,要将 business 改成 business-demo,解释一下涉及到的名词:

  • group:业务类型(接口组),每个业务一个 group,group 下面可以注册多个终端(SekiroClient),同时 group 可以挂载多个 Action;
  • clientId:指代设备,多个设备使用多个机器提供 API 服务,提供群控能力和负载均衡能力;
  • SekiroClient:服务提供者客户端,主要场景为手机/浏览器等。最终的 Sekiro 调用会转发到 SekiroClient。每个 client 需要有一个惟一的 clientId;
  • registerAction:接口,同一个 group 下面可以有多个接口,分别做不同的功能;
  • resolve:将内容传回给客户端的方法;
  • request:客户端传过来的请求,如果请求里有多个参数,可以以键值对的方式从里面提取参数然后再做处理。

说了这么多可能也不好理解,直接实战,还是以某团网页端登录为例,我们将 sekiro_web_client.js 与 SekiroClient 通信代码写在一起,然后根据需求,改写一下通信部分代码:

  1. ws 链接改为:ws://127.0.0.1:5612/business-demo/register?group=rpc-test&clientId=,自定义 group 为 rpc-test;  
  2. 5612:端口可以在108-sekiro\conf\config.properties种sekiro.port=5612  修改   
  3. 注册一个事件 registerAction 为 getToken;
  4. resolve 返回的结果为 (new window.abc).z(request["t"], parseInt(request["n"]) + 60 * (480 + (new Date).getTimezoneOffset()) * 1e3),即加密并返回客户端传过来的 url 参数。

完整代码如下(留意末尾 SekiroClient 通信代码部分的写法):

window.abc = e;    //把加密函数保存为全局变量  后面可以使用

(function () {
    'use strict';
    function SekiroClient(wsURL) {
        this.wsURL = wsURL;
        this.handlers = {};
        this.socket = {};
        // check
        if (!wsURL) {
            throw new Error('wsURL can not be empty!!')
        }
        this.webSocketFactory = this.resolveWebSocketFactory();
        this.connect()
    }

    SekiroClient.prototype.resolveWebSocketFactory = function () {
        if (typeof window === 'object') {
            var theWebSocket = window.WebSocket ? window.WebSocket : window.MozWebSocket;
            return function (wsURL) {

                function WindowWebSocketWrapper(wsURL) {
                    this.mSocket = new theWebSocket(wsURL);
                }

                WindowWebSocketWrapper.prototype.close = function () {
                    this.mSocket.close();
                };

                WindowWebSocketWrapper.prototype.onmessage = function (onMessageFunction) {
                    this.mSocket.onmessage = onMessageFunction;
                };

                WindowWebSocketWrapper.prototype.onopen = function (onOpenFunction) {
                    this.mSocket.onopen = onOpenFunction;
                };
                WindowWebSocketWrapper.prototype.onclose = function (onCloseFunction) {
                    this.mSocket.onclose = onCloseFunction;
                };

                WindowWebSocketWrapper.prototype.send = function (message) {
                    this.mSocket.send(message);
                };

                return new WindowWebSocketWrapper(wsURL);
            }
        }
        if (typeof weex === 'object') {
            // this is weex env : https://weex.apache.org/zh/docs/modules/websockets.html
            try {
                console.log("test webSocket for weex");
                var ws = weex.requireModule('webSocket');
                console.log("find webSocket for weex:" + ws);
                return function (wsURL) {
                    try {
                        ws.close();
                    } catch (e) {
                    }
                    ws.WebSocket(wsURL, '');
                    return ws;
                }
            } catch (e) {
                console.log(e);
                //ignore
            }
        }
        //TODO support ReactNative
        if (typeof WebSocket === 'object') {
            return function (wsURL) {
                return new theWebSocket(wsURL);
            }
        }
        // weex 和 PC环境的websocket API不完全一致,所以做了抽象兼容
        throw new Error("the js environment do not support websocket");
    };

    SekiroClient.prototype.connect = function () {
        console.log('sekiro: begin of connect to wsURL: ' + this.wsURL);
        var _this = this;
        // 不check close,让
        // if (this.socket && this.socket.readyState === 1) {
        //     this.socket.close();
        // }
        try {
            this.socket = this.webSocketFactory(this.wsURL);
        } catch (e) {
            console.log("sekiro: create connection failed,reconnect after 2s");
            setTimeout(function () {
                _this.connect()
            }, 2000)
        }

        this.socket.onmessage(function (event) {
            _this.handleSekiroRequest(event.data)
        });

        this.socket.onopen(function (event) {
            console.log('sekiro: open a sekiro client connection')
        });

        this.socket.onclose(function (event) {
            console.log('sekiro: disconnected ,reconnection after 2s');
            setTimeout(function () {
                _this.connect()
            }, 2000)
        });
    };

    SekiroClient.prototype.handleSekiroRequest = function (requestJson) {
        console.log("receive sekiro request: " + requestJson);
        var request = JSON.parse(requestJson);
        var seq = request['__sekiro_seq__'];

        if (!request['action']) {
            this.sendFailed(seq, 'need request param {action}');
            return
        }
        var action = request['action'];
        if (!this.handlers[action]) {
            this.sendFailed(seq, 'no action handler: ' + action + ' defined');
            return
        }

        var theHandler = this.handlers[action];
        var _this = this;
        try {
            theHandler(request, function (response) {
                try {
                    _this.sendSuccess(seq, response)
                } catch (e) {
                    _this.sendFailed(seq, "e:" + e);
                }
            }, function (errorMessage) {
                _this.sendFailed(seq, errorMessage)
            })
        } catch (e) {
            console.log("error: " + e);
            _this.sendFailed(seq, ":" + e);
        }
    };

    SekiroClient.prototype.sendSuccess = function (seq, response) {
        var responseJson;
        if (typeof response == 'string') {
            try {
                responseJson = JSON.parse(response);
            } catch (e) {
                responseJson = {};
                responseJson['data'] = response;
            }
        } else if (typeof response == 'object') {
            responseJson = response;
        } else {
            responseJson = {};
            responseJson['data'] = response;
        }


        if (Array.isArray(responseJson)) {
            responseJson = {
                data: responseJson,
                code: 0
            }
        }

        if (responseJson['code']) {
            responseJson['code'] = 0;
        } else if (responseJson['status']) {
            responseJson['status'] = 0;
        } else {
            responseJson['status'] = 0;
        }
        responseJson['__sekiro_seq__'] = seq;
        var responseText = JSON.stringify(responseJson);
        console.log("response :" + responseText);
        this.socket.send(responseText);
    };

    SekiroClient.prototype.sendFailed = function (seq, errorMessage) {
        if (typeof errorMessage != 'string') {
            errorMessage = JSON.stringify(errorMessage);
        }
        var responseJson = {};
        responseJson['message'] = errorMessage;
        responseJson['status'] = -1;
        responseJson['__sekiro_seq__'] = seq;
        var responseText = JSON.stringify(responseJson);
        console.log("sekiro: response :" + responseText);
        this.socket.send(responseText)
    };

    SekiroClient.prototype.registerAction = function (action, handler) {
        if (typeof action !== 'string') {
            throw new Error("an action must be string");
        }
        if (typeof handler !== 'function') {
            throw new Error("a handler must be function");
        }
        console.log("sekiro: register action: " + action);
        this.handlers[action] = handler;
        return this;
    };

    function guid() {
        function S4() {
            return (((1 + Math.random()) * 0x10000) | 0).toString(16).substring(1);
        }

        return (S4() + S4() + "-" + S4() + "-" + S4() + "-" + S4() + "-" + S4() + S4() + S4());
    }

    var client = new SekiroClient("ws://127.0.0.1:5612/business-demo/register?group=rpc-test&clientId=" + guid());

    client.registerAction("getToken", function (request, resolve, reject) {
		t = request["t"];
		n = request["n"];
		let toke = (new window.abc).z(t, parseInt(n) + 60 * (480 + (new Date).getTimezoneOffset()) * 1e3);
		console.log(toke);
        resolve(toke);
    })

})();

 

 

 

与前面的方法一样,使用浏览器开发者工具 Overrides 重写功能,将上面的代码注入到网页 JS 里:

然后 Sekiro 为我们提供了一些 API:

比如我们现在要调用 utility.getH5fingerprint() 加密方法该怎么办呢?很简单,代码注入到浏览器里后,首先还是要手动登录一遍,手动登录一遍,手动登录一遍,重要的事情说三遍!然后参考上面的调用转发 API 进行改写:

  • 我们自定义的分组 group 是 rpc-test;
  • 事件 action 是 getToken;
  • 待加密参数名称为t和n 其值例如为:70rq6UNE3JfnhG8f1RYiVrO84fLf68CX2uPNnen1yCI=(发送的时候要编码)和1680161464652

 

那么我们的调用链接就应该是:http://127.0.0.1:5612/business-demo/invoke?group=rpc-test&action=getToken&t=70rq6UNE3JfnhG8f1RYiVtU4wHhhexbVDSX8FLgSxIk=&n=1680162022083,直接浏览器打开,返回的字典,data 里面就是加密结果:

 

 

 同样的,在本地用 Python 的话,直接 requests 就完事儿了:

 

import re
from urllib.parse import unquote, quote

import requests
import urllib3
from yscredit_tools import Logger
from yscredit_tools.utils import retry

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

headers = {
    'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
    'accept-encoding': 'gzip, deflate, br',
    'accept-language': 'zh-CN,zh;q=0.9',
    'referer': 'https://www.zhipin.com/c101210100-p100101/',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4123.0 Safari/537.36'
}

session = requests.session()
session.headers = headers

headers1 = headers.copy()
params = {
    'page': '2',
    'ka': 'page-2',
}


@retry(5)
def get_check():
    proxies = {}
    session.headers = headers1
    res = session.get(url='https://www.zhipin.com/job_detail/?query=java&city=101210100&industry=&position=100101',
                      timeout=20, proxies=proxies)
    res.encoding = 'utf-8'
    seed, ts = re.findall('seed=(.*?)&name.*?&ts=(.*?)&callbackUrl', res.url)[0]
    Logger.error('seed:%s,ts:%s' % (unquote(seed), ts))
    print(unquote(seed), ts)
    print("http://127.0.0.1:5612/business-demo/invoke?group=rpc-test&action=getToken&t={}&n={}".format(unquote(seed), ts))
    a = requests.get("http://127.0.0.1:5612/business-demo/invoke?group=rpc-test&action=getToken&t={}&n={}".format(unquote(seed), ts)).json()['data']
    Logger.error(a)
    new_cookie = 'Hm_lvt_194df3105ad7148dcf2b98a91b5e727a=%s; Hm_lpvt_194df3105ad7148dcf2b98a91b5e727a=%s; __zp_stoken__=%s' % (
        int(ts) // 1000, int(ts) // 1000, quote(a))
    headers['cookie'] = new_cookie
    session.headers = headers
    res = session.get(url='https://www.zhipin.com/job_detail/?query=java&city=101210100&industry=&position=100101',
                      timeout=20, proxies=proxies)
    res.encoding = 'utf-8'
    if 'BOSS直聘' not in res.text:
        Logger.error('失败一次')
        return False
    Logger.error('成功!!')
    return True


if __name__ == '__main__':
    Logger.config(level="error", processname="Boss_zp_excejs", online=True)
    count = 0
    for i in range(30):
        flag = get_check()
        if flag:
            count = count + 1
    print('成功率:' + str(count / 30))

我们前面是把 sekiro_web_client.js 复制下来和通信代码一起注入到浏览器的,这里我们还可以有更加优雅的方法,直接给 document 新创建一个 script,通过链接的形式插入 sekiro_web_client.js,这里需要注意一下几点问题:

  1. 第一个是时机的问题,需要等待 document 这些元素加载完成才能建立 SekiroClient 通信,不然调用 SekiroClient 是会报错的,这里可以用 setTimeout 方法,该方法用于在指定的毫秒数后调用函数或计算表达式,将 SekiroClient 通信代码单独封装成一个函数,比如 function startSekiro(),然后等待 1-2 秒后再执行 SekiroClient 通信代码;
  2. 由于 SekiroClient 通信代码被封装成了函数,此时直接调用 e 是会提示未定义的,所以我们要先将其导为全局变量,比如window.abc = e;后续直接调用 window.abc = e 即可。

完整代码如下所示:

(function () {
    var newElement = document.createElement("script");
    newElement.setAttribute("type", "text/javascript");
    newElement.setAttribute("src", "https://sekiro.virjar.com/sekiro-doc/assets/sekiro_web_client.js");
    document.body.appendChild(newElement);

    window.abc = e;   // 保存为全局变量

    function guid() {
        function S4() {
            return (((1 + Math.random()) * 0x10000) | 0).toString(16).substring(1);
        }
        return (S4() + S4() + "-" + S4() + "-" + S4() + "-" + S4() + "-" + S4() + S4() + S4());
    }
	
	function startSekiro(){
		var client = new SekiroClient("ws://127.0.0.1:5612/business-demo/register?group=rpc-test&clientId=" + guid());

		client.registerAction("getToken", function (request, resolve, reject) {
			t = request["t"];
			n = request["n"];
			let toke = (new window.abc).z(t, parseInt(n) + 60 * (480 + (new Date).getTimezoneOffset()) * 1e3);   // 计算加密的地方
			console.log(toke);
			resolve(toke);
		});
	}

    setTimeout(startSekiro, 2000)
})();

优缺点

目前如果不去逆向 JS 来实现加密参数的话,用得最多的就是自动化工具了,比如 Selenium、Puppeteer 等,很显然这些自动化工具配置繁琐、运行效率极低,而 RPC 技术不需要加载多余的资源,稳定性和效率明显都更高,RPC 不需要考虑浏览器指纹、各种环境,如果风控不严的话,高并发也是能够轻松实现的,相反,由于 RPC 是一直挂载在同一个浏览器上的,所以针对风控较严格的站点,比如检测 UA、IP 与加密参数绑定之类的,那么 PRC 调用太频繁就不太行了,当然也可以研究研究浏览器群控技术,操纵多个不同浏览器可以一定程度上缓解这个问题。总之 RPC 技术还是非常牛的,除了 JS 逆向,可以说是目前比较万能、高效的方法了,一定程度上做到了加密参数一把梭!