来源:公司资讯 | 2021.08.16
一、应用背景
在第十六届全国大学生智能车竞赛全国总决赛中,为了适应线上总决赛的要求,室内视觉AI组的比赛采用了赛道积分与识别积分分离的比赛形式,这样可以保证比赛过程中更加的紧凑高效。
智能车在识别图片任务
为了避免人工对于识别过程的干预,整个识别过程是由计算机随机给出Apriltag,数字,动物以及水果图片,由参赛车模自动根据拍摄的照片给出识别结果。
由于之前的比赛,Apriltag,数字,动物以及水果分别位于赛道的不同位置,Apriltag位于赛道上,数字位于三岔路口,动物和水果则位于赛道两旁。所以智能车模可以预先根据车模所处在赛道的不同位置,指导摄像头所拍摄的图片中的种类分别属于哪一大类。然后在分别调取不同的识别模型和算法来进一步处理图片。
在新的比赛模式下,所有的图片都是随机出现,因此,需要预先判断图片属于哪一大类,然后才能够调取原来的识别模型。那么改如何设计一个简单的分类算法,将获取的图片先划分到三大类(Apriltag,数字以及动物与水果)呢?
本文下面就讨论一个利用图片的像素颜色来进行分类的简单算法。
二、原始数据
1、数据库来源
在第十六届智能汽车竞赛AI视觉组分赛区数据集发布给出了应用在智能车竞赛中的四类图片的数据集合以及下载的方式。
智能车竞赛数据集合:
AprilTag:25h9系列0~9
数字:0~9
动物图片:五个子类:牛(93)、狗(101)、猪(88)、猫(99)、马(95)
水果图片:橙子(86)、榴莲(75)、苹果(88)、葡萄(89)、香蕉(93)
数据库总体数量927张图片。
三、图片颜色
1、基本识别方案
为了建立一个非常简单的Apriltag,数字、动物和水果的分类器,需要结合已知先验知识,借助于简化的模式识别的方法建立分类器;
抛开对于图片内的形态识别特征,转换使用基于像素的统计规律,这样可以大大提高检测速度;
因此,计划使用图片的颜色空间的统计特性来区分三类。
由于Apriltag,数字都是黑白的图片;利用这一点可以用于区分水果与动物;
Apriltag与数字在黑白的占空比方面不同,可以利用图片的灰度分布统计来,或者平均灰度来区分这两类。
2、图片的RGB转换HSV
根据黑白图片与参赛图片之间关系,可以把Apriltag,数字分布与动物水果进行区分。为了有效区分彩色图片与黑白图片,则需要将图片从RGB转换到HSV空间。在HSV(Hue,Saturation,Value)中,S分量表示色彩的保护度,也就是颜色距离白色与纯色之间的差异度量。通常取0%~100%,S值越大颜色就越饱和。
3、利用平均色饱和度区分彩色与黑白图片
如果取一个阈值SminS_{\min}Smin作为区别黑白与彩色图片的阈值,SminS_{\min}Smin越大,对于黑白图片的误判成彩色图片概率就越低,但对于彩色图片误判成黑白图片的概率就越大。
当阈值取10的时候,判断黑白照片与彩色照片的正确率大约为95%,当阈值取20的时候,正确率已经下降到90%以下了。
由于使用摄像头摄取图片的时候,存在一定的图片白平衡失真,上面色饱和阈值不能够设置太高,否则就会使得黑白图片被误判成彩色图片。
4、图片灰度
如果仅仅通过色保护度来区分黑白图片(Apriltag,数字)与彩色照片(动物和水果)会存在比较大的误差。下面还可以通过图片的灰度分布差异来进一步区分黑白图与彩色图片。
对比黑色图片(Apriltag,数字)图片的亮度分布,它的分布主要集中在最高值与最低值,中间分布很少。因此,可以利用这个差异进一步区分黑白图片与彩色图片。
如果取35作为阈值,使用次级亮度平均值来区分黑白图与彩色图片,可以达到100%的正确率。
五、利用S,V区分设置分类器
为了提高分类器的适应性,可以考虑联合图片的S,V来区分黑白图与彩色图。计算图片的平均色饱和度值SaveS_{ave}Save以及次级平均亮度值VaveV_{ave}Vave。选择两个合适的阈值:STS_TST以及VTV_TVT,对于同时满足:Save六、区分Apriltag与数字
根据图片的平均色保护度以及次级平均亮度可以将黑白图片与动物水果图片区分开来。那么如何区分Apriltag与数字呢?
如果对于前面给出的APriltag和数字亮度值的分布来看,可以看到Apriltag的黑色背景值比白色背景多,而数字则恰好反过来,它的白色背景像素多余黑色背景像素。利用这一点差异,可以对于黑白图片中的黑色像素(也就是V值低于图片平均灰度的像素)的个数进行统计,如果黑色像素的个数高于所有像素个数的50%,则是Apriltag图片,反之则是数字图片。
※算法总结※
对于全国大学生智能车竞赛竞赛室内视觉AI组用于识别Apriltag,数字,动物以及水果任务,本文提出了基于图片像素的HSV空间的统计值,建立了一个简单的大类分类器。利用这个分类器可以非常精确的在第一时间吧图片分成Apriltag,数字以及彩色图片(动物和水果),然后在利用不同的识别模型进一步识别。
由于这个过程应用了对于图片库的先验知识,一方面可以继续应用原来已经建立好的Apriltag、数字、动物以及水果识别模型,另一方面也可以提高整个识别的效率。
对于本文前面提到的算法中的阈值,需要根据实际采集到的图片进行进一步优化,使得最终的识别效率达到最高。