悦来客栈的老板 发表于 2020-11-23 21:47:37

JS逆向:Wasm文件导出函数的调用|猿人学爬虫对抗赛第十五题

实战地址http://match.yuanrenxue.com/match/15抓包分析



地址栏输入 地址,按下F12并回车,发现数据在这里:










cookie无加密,有个params参数m,切换 Initiator,查看调用栈:









跟踪进去,直接就跟踪到了数据加密及发送的地方:







关键加密函数 window.q,控制台输入,发现无法跟进,看到上面的定义代码,原来是  WebAssembly。没接触过,该怎么办?




不慌,我们有强大的搜索引擎。




wasm逆向分析



通过一番搜索后,找到了wasm文件的在线解析网站:
https://webassembly.github.io/wabt/demo/wasm2wat/
上传文件后,解析的部分代码如下:










快1000多行的代码,如果硬刚的话,是不是有点掉头发?





不慌,继续使用搜索引擎,看看有没有直接调用wasm文件的库。




通过一番搜索后,找到了 pywasm 这个库:



http://accu.cc/content/py/pywasm/overview/



根据它上面的示例代码,很快就写出了爬取代码:






# -*- coding: utf-8 -*-
import math
import random
import time
import pywasm
import requests
def main():
    sums = 0
    headers = {"User-Agent": "yuanrenxue.project",}
    t = int(time.time())
    t1 = int(t / 2)
    t2 = int(t / 2 - math.floor(random.random() * 50 + 1))
    vm = pywasm.load("./main.wasm")
    r = vm.exec("encode", )
    m = f"{r}|{t1}|{t2}"
    for i in range(1, 6):
        params = {
            "m":m,
            "page":i,
            }
        response = requests.get(url="http://match.yuanrenxue.com/api/match/15",params = params,headers=headers).json()
        for each in response["data"]:
            print (each["value"])
            sums += each["value"]
    print(sums)
    # 219388
if __name__ == "__main__":
    main()



部分代码由 @Sitoi提供,在此感谢。








通篇下来,基本没啥难度吧。





遇到这类问题时先不要慌,搜索引擎能解决 99% 的问题,另外1%可能就需要充钱解决了。







本文首发微信公众号:菜鸟学Python编程,欢迎关注。









ShowMaker 发表于 2020-11-24 09:09:19

666666

mixin 发表于 2020-11-24 10:40:52

强啊宝贝

我想两颗西柚 发表于 2020-11-24 10:49:26

6666666

johnyyc 发表于 2020-11-24 14:37:55

666

smart 发表于 2020-11-24 15:02:37

66

IAMKEN 发表于 2020-11-24 17:22:08

666

cc 发表于 2020-11-25 11:07:05

666

chenqilei 发表于 2020-12-3 10:54:42

1

zxbzxb180 发表于 2021-1-18 19:56:36

666
页: [1] 2 3
查看完整版本: JS逆向:Wasm文件导出函数的调用|猿人学爬虫对抗赛第十五题