求高手指导帮助网页爬虫个人小项目，有偿

hzqldjb65078195

目前在爬一个学习网站，Chegg，https://www.chegg.com/ 但发现有些答案图片无法爬取。原因是无法爬取HTML源代码, 所以现在尝试使用selenium模拟登录。我的需求是使用pdfkit 把网页数据打印成pdf。我想把此爬虫部署到个人网页上，然后用户可以使用我分发的UUID使用此爬虫一次。需要实现多线程访问程序，由于对selenium不熟悉，我不知道selenium是否可以一直保持登陆状态。目前思路是保持selenium登录状态，然后在登录状态下实现个人网页多线程访问，保证爬虫持续工作。目前不知道如何用selenium模拟地址栏输入不同url进行爬取。需要高手指点调试，有偿

haonit · 发表于 2020-12-3 14:28:30

可聊

求高手指导帮助网页爬虫个人小项目，有偿

hzqldjb65078195 LV1