- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
LOG颜色空间不变性用于行人识别 郭涛
今日工作:
使用颜色的不变性进行行人识别算法中,识别阈值的确定,以及与当前ATS图像搜索算
法相对比;
阈值的确定:
A、从样本库抽取500张正向样本和500张负向样本,样本库来自于当前ATS图像搜索算法
在每帧图像中检测到的目标,共有1866张图像,其中误检的有1283张,整体误检率为
68.8%;
目标 负向样本 正向样本
B、分别计算正向样本和负向样本与目标之间的EMD距离;
图一 正向样本与目标之间的距离
图二 负向样本与目标之间的距离
C、可以大概确定阈值应该在30~50之间,分别计算阈值为30~50时,正向样本的误检
率和负向样本的误检率,取两者的交点对应的阈值为最终阈值;
图三 绿色为正向样本的误匹配率变化曲线
红色为负向样本的误匹配率变化曲线
D、取阈值为37,这样,正向样本的误检率为19%,负向样本的误检率为18.6%,和原方法
相比,性能有所改善。
遇到问题:
上述方法得到的阈值用于图像搜索,效果很不理想,误检率很高,需要进一步分析。
如上图所示,要检测的目标为: ,结果检测到的目标有上百个,观察每个检测结果与目标之间的距离,发现实际目标的距离为10:
观察目标图像和与目标图像距离最近的误检测图像,取到的特征点在log颜色空间的映射区域的形状差别不大,但是观察实际图像,相差很大,怀疑阈值的选择方法和算法实现中取形状上下文特征部分都有问题,需要进一步分析解决:
郭涛
今日工作:
解决基于颜色不变性进行行人识别方法中形状上下文特征选取的问题,得到一个较好的
图像搜索效果。
对算法所做的改进:
取形状上下文特征前距离做归一化:误检400+个目标;
取形状上下文特征前距离不做归一化:误检19个目标;
取形状上下文特征时半径量化度从5增加到9:误检3个目标;
取形状上下文特征时半径量化度从9增加到10,角度量化度从12增加到16:误检
0个目标;
最终,对于目标 ,在一帧图像中的搜索结果如下:
遇到问题:
上述方法的改进对于颜色不太鲜艳的目标检测效果仍不太理想,仍需继续改进。
问题详细说明:
对于如下目标, ,在一帧图像中的搜索结果如下:
对比比较接近的误检目标与实际目标,如下图所示:
发现两幅图像上下部分取到的随机点在log颜色空间中映射的区域比较相似,并且由于上下部分的颜色相似,上下区域在log空间中几乎重叠,这种情况使用形状上下文方法取特征计算会有问题,需要做改进,并且取随机点的方式也需要改进。 郭涛
今日工作:
改进基于Log空间颜色不变性进行行人识别算法中随机点选取方式,将之前选取随机点
的区域扩大到整个上半区域和下半区域,通过实验验证改进后的算法,性能有所提升(见
下图);
实验结果:
目标
搜索结果1
搜索结果2
搜索结果3
B、目标
搜索结果:
C、目标
搜索结果:
D、目标
搜索结果:
E、目标
搜索结果:
F、目标
搜索结果:
G、目标
搜索结果1:
搜索结果2:
H、目标
遇到问题:
上述算法对于上下身颜色差别不大的目标,检测效果会相对较差,参见实验结果A和G,
对这种情况仍需对算法进行改进; 郭涛
今日工作:
使用新的视频验证该算法的效果,实验结果如下:
尝试解决上下颜色相似情况下误检的问题。
实验结果:
目标
搜索结果:
B、目标
搜索结果:
C、目标
搜索结果1:
搜索结果2:
D、目标
搜索结果:
E、目标:
搜索结果:
上述实验中,目标C在侧面时误检较多,目标D搜索结果很不理想,观察目标D和检测到的结果,两者随机点在LOG颜色空间中的分布确实十分相似,只是分布位置相差较远,目标上下部分大部分都是黑色,检测结果大部分都是绿色,上下颜色相似;
为了解决上述问题,做了如下尝试:
尝试1:
首先使用EMD计算出两者特征之间的最小代价,如
文档评论(0)