5回答

2收藏

讨论一下通用分布式爬虫框架的设计及开发经验

问答交流 问答交流 3508 人阅读 | 5 人回复 | 2019-11-25


分享下最近总是被问到的一个问题:是否有通用分布式爬虫框架的设计及开发经验?

在 scrapy 的框架思想下,结合 pyspide r的 ui 界面,自定义配置数据库及账号,点选 html 标签后自动抓取相对应字段数据.配置及勾选后生成 scrapy-redis 代码.

当然,框架需要能承载大量项目的部署及监控警报...

有没有大佬出来分享下...
分享到:
回复

使用道具 举报

回答|共 5 个

花儿谢了

发表于 2019-11-25 19:13:17 | 显示全部楼层

没有xxxxx开发经验,打扰了,我走了
回复

使用道具 举报

spidermen

发表于 2019-11-26 09:34:05 | 显示全部楼层

大佬别急,留下思路和想法再走不迟.
回复

使用道具 举报

非牛

发表于 2019-11-26 10:02:19 | 显示全部楼层

大兄弟,你这是让搞爬虫的同志们下岗啊
回复

使用道具 举报

花儿谢了

发表于 2019-11-26 10:03:22 | 显示全部楼层

建议了解一下我们团队的aiocxa,反正我个人是不喜欢用scrapy这类东西,还是asyncio一把梭舒服,当然只是个人拙见,还是看场景。。。
回复

使用道具 举报

陈祥安

发表于 2019-11-26 10:05:46 | 显示全部楼层

aiohttp+motor就可以了
回复

使用道具 举报