1回答

0收藏

求高手指导帮助网页爬虫个人小项目,有偿

问答交流 问答交流 1943 人阅读 | 1 人回复 | 2020-09-12


目前在爬一个学习网站,Chegg,https://www.chegg.com/ 但发现有些答案图片无法爬取。原因是无法爬取HTML源代码, 所以现在尝试使用selenium模拟登录。我的需求是使用pdfkit 把网页数据打印成pdf。我想把此爬虫部署到个人网页上,然后用户可以使用我分发的UUID使用此爬虫一次。需要实现多线程访问程序,由于对selenium不熟悉,我不知道selenium是否可以一直保持登陆状态。目前思路是保持selenium登录状态,然后在登录状态下实现个人网页多线程访问,保证爬虫持续工作。目前不知道如何用selenium模拟地址栏输入不同url进行爬取。需要高手指点调试,有偿
分享到:
回复

使用道具 举报

回答|共 1 个

haonit

发表于 2020-12-3 14:28:30 | 显示全部楼层

可聊
回复

使用道具 举报