回答

收藏

google专利网站爬取

信息分享 信息分享 1630 人阅读 | 0 人回复 | 2020-11-19


https://patents.google.com/patent/CN108792667A网站底部部分为JavaScript动态加载的

红圈部分也是JavaScript下载的,不是请求的API。请问一下我要如何爬取,现在的方案是selenium可以实现功能,但是速度是非常慢的。我正在尝试splash,但是在这过程中我遇到了一些问题,我不知道如何使用lua脚本定位到该处,点击之后文件如何保存。初学者一名,还请各位多指教。或者还有其他更好的方案吗?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
分享到:
回复

使用道具 举报