边界提升MSER算法和原始MSER算法的实验结果分析

1 边界提升MSER算法和原始MSER算法的对比测试 自然场景中图像存在着或多或小的差别,实验结果如下表所示,可以从中看出:边界提升MSER算法相比于原始的MSER提取的区域个数大约减少了35%左右。 表2 边界提升MSER算法提取区域个数统计 区域个数比 平均耗时 原

1 边界提升MSER算法和原始MSER算法的对比测试
       自然场景中图像存在着或多或小的差别,实验结果如下表所示,可以从中看出:边界提升MSER算法相比于原始的MSER提取的区域个数大约减少了35%左右。
表2   边界提升MSER算法提取区域个数统计

    区域个数比 平均耗时
原始MSER   1.00 0.46
边界提升MSER 边界提升MSER算法和原始MSER算法的实验结果分析S=50% 0.62 0.49
边界提升MSER算法和原始MSER算法的实验结果分析S=60% 0.65 0.49

2 MSER的优缺点
       按步骤来,首先是输入一幅图像,然后进行必要的预处理,例如灰度化,再提取MSER区域,最后再把经过处理之后的区域转换为二值图像,利用所获取的区域坐标信息,把所得到的区域二值图像进行连通域分析,首先直接剔除一部分字符特征明显不符合的区域,接下来对剔除留下来的图像进行闭运算,最后在将进行了闭运算之后的图像再一次剔除,经过两次剔除之后留下来的区域为文本区域的包围盒。实验结果将在下面展示出来,靠左是未识别之前的图,靠右是识别之后的图片,绿色的线标注出来的区域为文本所在区域。
边界提升MSER算法和原始MSER算法的实验结果分析边界提升MSER算法和原始MSER算法的实验结果分析
图9 识别后                   图10 识别前
边界提升MSER算法和原始MSER算法的实验结果分析边界提升MSER算法和原始MSER算法的实验结果分析
图11 识别前                         图12 识别后      
       但是在处理过程中发现一些问题,部分图片的曝光好坏直接影响到图片处理的结果,考虑到文本检测的主要服务对象,图像的采集过程中没有刻意的去追求过度曝光或者欠曝光效果的情况,理想的检测输入仍然以均匀分布为宜。事实上,适度的欠曝光在MSER检测结果中,在保留全部文本区域的基础上,有着小部分区域的错误检测,作为MSER检测的输入来说,欠曝光的图像是处理起来最为理想的,但是这样说起来,“适度”的标准难以量化,没有具体的数值来表示,并且,刻意的去追求欠曝光的效果造成图像的亮度区域细节的丢失,可能造成更大的不便,带来更多的不利影响,由此得出,在MSER处理的过程中,第一步统一对需要检测的图像进行灰度转换,具体的操作为应用线性变换对图像的灰度直方图做水平方向的拉伸。
       从上述公式可以看出,此操作的目的在于对图像的线性进行调整,对上述灰度变换操作进行相当于地势落差的拉伸,分水岭更加的明显,高耸,集水区域更为凹陷,山壁则变得更加的陡峭,单位注水量使得集水盆的变化更加的明显和细腻。虽然说经过一些列的处理之后,mser的检测结果会在一定程度上受到影响,但是,由于灰度变换并不改变图像局部的亮度极值的位置,极值区域的外缘变化将在可接受的范围内,这一结论同时也印证了MSER对线性光照变化的不敏感。
       对预处理后的图像再做MSER检测,就可以得到如下图所示的输出结果,其中最大稳定极值区域由绿色方框标识,方框之间存在着相互嵌套。几乎所有的文字都在绿色方框内,充分说明了对文本对象所做出的假设是合理的,将最大稳定极值区域当作候选文本区域是可以行的通的。
       自然场景文本检测仅仅使用了像素的亮度信息,缺乏对文本对象的个性化挑选,输出结果当中必然包含了大量的非文本区域。为了提高检测的准确率,需要借助必要的条件对标记出来的区域进行筛选。往往MSER算法会训练分类器用于区分文本和非文本区域,使用的特征包括字符的高宽比,颜色的一致性,紧密度,结构孔洞的数量,相对段落的高度,骨架长度和周长之比等一些列,上述特征都具有尺度不变性。本文通过检测尺寸与高宽比对标记内容,然后借助字符的其他特征,进一步进行文本区域的剔除,减轻背景以及噪音对文本检测的干扰。
    本文中自然场景文本检测在原图像的灰度变化副本上进行,输出结果仍然显示在原始图像上面,这样一方面保证了算法的运行效率,另外一个方面也为接下来的背景分离技术保留了颜色还有纹理线索,当然,MSER应用在场景文本的检测野存在着一定的局限性,在文本与背景相似度或者背景中存在着与文本尺寸很接近的的栅栏时,MSER检测几乎不可能提供任何有用的价值信息。
       虽然如此,但是基于MSER的文本检测算法仍然对自然场景中的文本检测做出了巨大的贡献,利用MSER的特性,算法首先对场景文本中进行预处理:图像做尺寸归一化和灰度变换,提成算法的运行效率以及缓解图像的曝光等问题,然后基于线性时间检测算法提取图像中的MSER区域,并且依据筛选出的结果进行后续的处理,就可以得到大概的候选文本区域。从检测的结果来看,基于极值稳定区域算法完整覆盖了场景中的全部文本对象,有力的证明了前提假设的合理性,与此同时算法时间的复杂程度为线性,运行效率较高,有着很大的发展前景。但是基于极值稳定区域对场景文本的额提取比较粗糙,即通过筛选,合并之后的处理操作,输出的结果之中仍然包含着大量的非文本区域。

原创文章,作者:写文章小能手,如若转载,请注明出处:https://www.sbvv.cn/chachong/607.html,文章版权申述

(0)
上一篇 2017年9月7日 上午1:06
下一篇 2017年9月8日 上午12:17

相关推荐

My title page contents