18回答

0收藏

干扰信息较多的图片验证码识别问题,求帮看!

问答交流 问答交流 6748 人阅读 | 18 人回复 | 2019-11-26


这种验证码应该用什么方法识别比较好呢?







我用 pytesseract 库和 ocr 识别不出来呀,求大佬帮看一下,谢谢!
分享到:
回复

使用道具 举报

回答|共 18 个

路过的憨憨

发表于 2019-11-26 11:15:24 | 显示全部楼层

这种我比较建议一步到位上打码平台,纯英文打码毕竟也不大贵
回复

使用道具 举报

sfhfpc

发表于 2019-11-26 11:18:15 | 显示全部楼层

这个因该从钱、时间和技术等几个方面考虑。

如果经费足够,那么选择打码平台也是可以的,毕竟又快又稳定。

如果不想花钱,愿意从技术方面下手,那么深度学习中的卷积神经网络可以很好的应对这种验证码。不过得准备足够多的验证码样本并且一一进行标注。

根据你自身条件进行衡量咯
回复

使用道具 举报

ntfans

发表于 2019-11-26 11:18:53 | 显示全部楼层

谢啦。主要是想看有什么好技术能做的,也想学习一下。
回复

使用道具 举报

ntfans

发表于 2019-11-26 11:19:26 | 显示全部楼层

好的,谢谢大佬的建议!
回复

使用道具 举报

vimin

发表于 2019-11-26 11:38:45 | 显示全部楼层

我提个方向建议:观察图片,5个字符(字符不重叠/黏连),5个干扰。颜色深浅上看字符和干扰可能很接近/相同。但是字符都是很规则的图形,没有拉伸。所以可以手动获取26个字符的点集关系,然后用算法匹配处理过背景的验证码。
回复

使用道具 举报

vimin

发表于 2019-11-26 11:40:22 | 显示全部楼层

楼主给个获取图片的连接,和其反爬的页面连接。
回复

使用道具 举报

qq16531218653

发表于 2019-11-26 11:42:00 | 显示全部楼层

试试冷月大佬的通用识别
回复

使用道具 举报

ntfans

发表于 2019-11-26 12:12:46 | 显示全部楼层

https://us.ceair.com/zh/ 在航班动态栏里面
回复

使用道具 举报

ntfans

发表于 2019-11-26 12:13:57 | 显示全部楼层

ok, 我看看 谢啦
回复

使用道具 举报