2008-01-28
网站验证码识别程序探讨 (1)
关键字: 验证码 图像识别
作者:caocao(网络隐士),http://www.caocao.name/,http://www.caocao.mobi/
转载请注明来源:http://www.javaeye.com/topic/159922
顾名思义,隐士这里想探讨一下验证码识别程序的设计,至于如何使用这样的程序则不在技术讨论的范围内。
先来看一下隐士这个.net程序的效果。这样的验证码图片在很多网站都有,看上去识别效果还不错。
下面介绍一下该算法的特点:
1、只能识别已知字体、字号,对字母没什么要求,英文字母、数字、中文字都可以。
2、只能识别不扭曲、镜像、旋转的字。
3、对噪点、干扰线不太敏感。
由上面的特点可知,这算法其实是很脆弱的,只要验证码生成程序稍微做一点点旋转就可以令其失效。那么该算法做了些什么呢?
这算法只做了一件事情,就是按照已知字符串的图像去验证码图像里扫描,扫到匹配的就成了,当然算法内部会有一些小调整以降低误认率。仅仅这点就足矣识别大量网站的验证码了。效果图里的验证码是由Discuz! 5.5产生的一种,CSDN现阶段的验证码图片一样可以用这个算法来识别。看官如有兴趣,请联系隐士共同探讨。
转载请注明来源:http://www.javaeye.com/topic/159922
顾名思义,隐士这里想探讨一下验证码识别程序的设计,至于如何使用这样的程序则不在技术讨论的范围内。
先来看一下隐士这个.net程序的效果。这样的验证码图片在很多网站都有,看上去识别效果还不错。
下面介绍一下该算法的特点:
1、只能识别已知字体、字号,对字母没什么要求,英文字母、数字、中文字都可以。
2、只能识别不扭曲、镜像、旋转的字。
3、对噪点、干扰线不太敏感。
由上面的特点可知,这算法其实是很脆弱的,只要验证码生成程序稍微做一点点旋转就可以令其失效。那么该算法做了些什么呢?
这算法只做了一件事情,就是按照已知字符串的图像去验证码图像里扫描,扫到匹配的就成了,当然算法内部会有一些小调整以降低误认率。仅仅这点就足矣识别大量网站的验证码了。效果图里的验证码是由Discuz! 5.5产生的一种,CSDN现阶段的验证码图片一样可以用这个算法来识别。看官如有兴趣,请联系隐士共同探讨。
评论
我佛山人
2008-03-11
现在网上很多验证码,用模拟精灵都能很轻易识别
qiuwenb
2008-02-03
能否把源代码共享一下
caocao
2008-01-29
qiuwenb 写道
什么语言编的,有源代码么
用C#写的,源码肯定有
qiuwenb
2008-01-28
什么语言编的,有源代码么
发表评论
提醒: 该博客已发表在公共论坛,博客所有留言会成为论坛回贴,留言请注意遵守论坛发贴规则
- 浏览: 117612 次
- 来自: 上海

- 详细资料
搜索本博客
最新评论
-
《神奇四侠2》抹黑上海, ...
好像看过了..
-- by femto -
《神奇四侠2》抹黑上海, ...
老外可以理解为不理解 自己人恶心自己人就让人忍不了了 看看国内的电影 叫 ...
-- by protti -
《神奇四侠2》抹黑上海, ...
因为04年的时候上海有反日游行 所以看起来上海很仇日 但是真的是这样吗? ...
-- by cddcdd -
硅谷之行 (28) 一进旧金山 ...
图文并茂,风趣盎然. Look forward to the next one. ...
-- by qlheng -
关于识别相似图像的算法探 ...
corvallis 写道说错了。用SIFT的feature直接计算distanc ...
-- by caocao






评论排行榜