基于马赛克图形的人机识别系统的设计与分析(2)
2013-05-11 18:00
导读:随着计算机视觉和模式识别的进步,这种基于文本的CAPTCHA已经没有原来那么有效,更容易受到特定的攻击。目前,计算机还不能完成很多与视觉相关的任
随着计算机视觉和模式识别的进步,这种基于文本的CAPTCHA已经没有原来那么有效,更容易受到特定的攻击。目前,计算机还不能完成很多与视觉相关的任务,而这些任务对于人类来说是容易的,可以利用这一点来设计一种方法来区别人类和机器人。
AlessandroBasso和StefanoSieeo提出了一种算法,被命名为”MosaHIP”是Mosaic—basedttumanInteractiveProof(基于马赛克的人机互动证明)17],它利用了现有的计算机在执行中的一些困难:1)在复杂背景下的,在感兴趣的区域中的图像分割:
2)在背景混乱情况下的特定概念的识别:
3)特定转化被应用到图像后的图形匹配。
”MosaHIP”是基于将图像进行拼凑、镶嵌,使用一个由许多小的,部分重叠的图像来组成大的图像的想法。这些小的图像来自两不同的类别:
1)描述真的,有意义概念的图像:
2)描述人工的或没有意义概念的图像。
只有很少的一部分图像是真的,属于第一类,它们需要被用户识别,它们伪随机的放置在拼凑的图像中.并且彼此是重叠的,这,对于计算机来说,识别它们不是容易的事情。剩下的假的图像是由真的图像的颜色直方图中的随机的颜色产生的图形、线等,它被用来产生混乱的背景,目的是为了使机器人识别真的图像困难。
图1显示的是基于概念的MosaHIP,要求用户识别被拼凑的图像中包括的真的图像。网2显示的是“最上层”的MosaHIP.要求户识别描述“一些存在”意义的和“放置在最上层”的,不被其他图像覆盖的图像。
AlessandroBasso和StefanoSicco提出的算法虽然可以在一定程度上区分机器人和人类,但还是存在一些缺陷:
(转载自科教范文网http://fw.nseac.com)
首先在算法描述中就存在错误,在第四步中,确定图像I_l所在的区域,将I_】分为4个相同面积的区域,随机的选择一个区域,并放置Ij在这个区域中,与Ij一重叠,这就存在1/4的几率会完全的覆盖图片Ii
另外,该算法在安全方面也存在着一定得缺陷:1)无论是基于概念的还是“最上层”的MosaHIP,都有一张完全没有被覆盖的真的图片暴露;2)每放置一张新的真的图片,它就会覆盖上一张图片的1,4区域,无论真的图片的顺序是什么,位置是什么,这些真的图片所在的区域的图片位置是有规律可循的,这就使机器人识别图片变得容易
2一个改进的基于马赛克图形的人机识别算法
对AlessandroBasso和Stefa130Sicco提出的算法的改进方案:1)在图像数据库P中选择n个图像,将它们添加到真的图像集合R={I….,1中;如果是基于概念的方法,随机的选择图像I∈R,确定它的种别G,否则I:=I。2)对于每一个Ij∈R,随机的选择缩放比例因数Si,S≤Sj≤S,根据Sj对Ij使用缩放比例函数;确定I.是否需要旋转,随机的选择旋转角度0,0≤o≤0,根据0.旋转Ij;确定Ij的透明度,随机的选择透明度因数,0≤T≤TAX,如果T.:!=O,根据对Ij使用透明度函数:
3)制作长m宽n的透明的图像c:在e上随机的选择一个位置,将I∈R放置在这个位置上,确保I没有超过c的边界;如果Ii=I,在集合D中保存I,的左上和右下的坐标:
4)对于每一个IiER,2≤j≤n;确定图像Ij一所在的区域,将Ij一。分为4个相同面积的区域,随机的选择一个区域,并按这个区域的方向,在这个区域中随机的选择一个新的区域,这个新的区域的面积≥原来区域的3/5,并放置Ij在这个新的区域中,与li一重叠,并保证它不覆盖Ij.,;如果是基于概念的方法Ii不能重叠预先放置的I,1≤k≤j;如果Ii=I,在集合D中保存I的左上和右下的坐标;