2回答

0收藏

请教一下scrapy获取frame页面信息问题

问答交流 问答交流 2155 人阅读 | 2 人回复 | 2020-03-11




这个网站有frame页面,直接访问会返回“非法连接”。

我现在想爬frame页面所有信息,selenium可以切换到frame进行获取,但数据量比较大。所以我用crawlspider去爬,应该怎样去切换到frame页面?

另外我用普通spider去进行yield url的也可以获取,但比较麻烦,要进行页判断等等

萌新请教一下各位大神




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
分享到:
回复

使用道具 举报

回答|共 2 个

loco

发表于 2020-3-14 14:04:32 | 显示全部楼层

frame你就当成另一个页面处理就行了,原本的页面怎么处理你就怎么处理,该带referer就带referer。
回复

使用道具 举报

yeyang

发表于 2020-3-25 07:17:32 | 显示全部楼层

目测 allowed_domains =  设置问题    尝试注释掉这项设置之后在启动.    如果使用crawlspider 爬的话建议成当前 url根域名
回复

使用道具 举报