抓取相关程序

我要开发同款
笑傲江湖程序猿2022年09月11日
102阅读

作品详情

1、下载每一个案子的docx需要

这个 url 地址

2、经过分析每一个案子的docx url 地址 组成为 domain(域名)+case id(案子标记符)+faxin token(登录用户标记符)+TENANT_ID(id标记)+type(下载文档类型) ;域名、TENANT_ID和文档类型是死的,用户token也可以通过每次登录后查看浏览器获取到,那关键就是获取到案子标记符。怎获取案子 标识符呢?

3、通过分析谷歌浏览器 DevTools开发者工具的 Network 查看到内容请求是通过search请求获取到的。 search 请求的 url 为 https://wenshu.faxin.cn/faxin/search/search 请求体为 巴拉巴拉... (JSON格式) :包含每次 请求的关键词、筛选的年份、刑事类型,以及每次获取的案子分页信息(from: xxx ,size :10) 响应体为 巴拉巴拉.... (JSON格式) : 返回数据包括 每个案子的 标记符 即为 类似:"uniqid": "9bd96bba-ef58-f61b-8304-d75635e58975"

这样上述问题要获取案子标识符id的问题就得以解决

这样写个循环,每次请求设置好 请求筛选参数、分页信息、用户标识符等 ,就可以得到返回信息的案子标识符id

然后根据步骤1 拼接url 下载文档即可。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论