google专利网站爬取 Web逆向 无合适标签 未标注

箫小春 6天前 60

https://patents.google.com/patent/CN108792667A网站底部部分为JavaScript动态加载的

红圈部分也是JavaScript下载的,不是请求的API。请问一下我要如何爬取,现在的方案是selenium可以实现功能,但是速度是非常慢的。我正在尝试splash,但是在这过程中我遇到了一些问题,我不知道如何使用lua脚本定位到该处,点击之后文件如何保存。初学者一名,还请各位多指教。或者还有其他更好的方案吗?

最新回复 (0)
返回