11回答

4收藏

高级爬虫面试题测试题 v1.3

信息分享 信息分享 807 人阅读 | 11 人回复 | 2021-10-13





Python Web高级爬虫工程师测试题

(请本文件发送到: SpiderTestQuestion@163.com 并附带简历)

1、 用yield写一个斐波那契数列的生成器函数。

2、 放一段scrapy项目parse函数的代码(解析列表页,使用分组提取,解析字段)。

3、 遇到过哪些反爬策略,如果突破?

4、 scrapy各个模块启动顺序(Spider, Middleware, Pipeline的加载、实例化、Open、Close的顺序)。

5、 使用过哪些抓包工具,各有什么优点。

6、 有没有自己博客,贴一下网址。

7、 字体加密反爬机制及分类。

8、 遇到过那些验证码,怎么突破的,不使用打码平台有办法吗?

9、 简述了解的采集任务管理平台,有何不同,有修改过源码吗?

10、 遇到过哪些难度大的网站,卡在哪了,认为反爬的天花板网站/软件有哪些。

11、 selenium/splash/puppeteer(谷歌)/playwright(微软)/web scraper(插件) 优劣势。

12、 js/小程序/apk的Hook 原理。

13、 遇到过那些防御系统,极验验证码/易盾/观镜防御系统反爬策略优劣。

14、 简述绕过小程序动态调试中用户验证的方式。

15、 还有哪些问题是没问到的,又是自己的优势优点,可自行作答




见附件:附件:高级爬虫面试测试题 v1.3
分享到:
回复

使用道具 举报

回答|共 11 个

franky

发表于 2021-10-13 13:46:02 | 显示全部楼层

666
回复

使用道具 举报

蜘蛛侠

发表于 2021-10-13 16:52:51 | 显示全部楼层

111
回复

使用道具 举报

dadadahao

发表于 2021-10-13 17:47:04 | 显示全部楼层

666
回复

使用道具 举报

予默子

发表于 2021-10-15 11:03:17 | 显示全部楼层

111
回复

使用道具 举报

Cc_

发表于 2021-10-15 14:00:14 | 显示全部楼层

666
回复

使用道具 举报

叫我阿松就好

发表于 2021-10-15 14:49:22 | 显示全部楼层

111
回复

使用道具 举报

张通

发表于 2021-10-25 14:58:23 | 显示全部楼层

回复

使用道具 举报

为了一只鸡腿

发表于 2021-10-26 10:16:30 | 显示全部楼层

666
回复

使用道具 举报

世界核平

发表于 2021-10-27 17:51:02 | 显示全部楼层

66666
回复

使用道具 举报