箫小春 发表于 2020-11-19 09:16:30

google专利网站爬取


https://patents.google.com/patent/CN108792667A网站底部部分为JavaScript动态加载的

红圈部分也是JavaScript下载的,不是请求的API。请问一下我要如何爬取,现在的方案是selenium可以实现功能,但是速度是非常慢的。我正在尝试splash,但是在这过程中我遇到了一些问题,我不知道如何使用lua脚本定位到该处,点击之后文件如何保存。初学者一名,还请各位多指教。或者还有其他更好的方案吗?
页: [1]
查看完整版本: google专利网站爬取