2回答

0收藏

爬虫与数据清洗

问答交流 问答交流 1405 人阅读 | 2 人回复 | 2021-07-09


大佬们,有个需求暂时想不到好的办法,假如我有十万条数据需要爬取,用了多线程差不多要20分钟,我每隔一小时爬取一次,然后再计算相同商品的前后一小时某个值的差值,以前这种需求是爬取完,在总个清洗,但现在时间必须压缩在半小时内,大佬们有没有好点的方案
分享到:
回复

使用道具 举报

回答|共 2 个

kbqncf

发表于 2021-7-20 14:09:37 | 显示全部楼层

不是20分钟就可以采集完了吗?
抓取和清洗程序分开处理不就完事了吗?
回复

使用道具 举报

dt_dream

发表于 2021-7-27 10:55:28 | 显示全部楼层

请问这个问题难点在哪???
回复

使用道具 举报