自己找教学场景相关github目标识别代码研读(10.21~10.28)

发布时间 2023-10-23 21:41:54作者: 长大想当太空人

任务:

1、解决上次老师问的一些问题?

(1)上次老师提到F1得分,再总结一下:

混淆矩阵

TP:预测正例,实际正例(预测对)

FN:预测负例,实际正例(预测错)

FP:预测正例,实际负例(预测错)

TN:预测负例,实际负例(预测对)

精确率 = TP / (TP+FP) :预测为正例的那些数据里预测正确的数据个数(预测为正例的有多少预测对了,预测为正例且预测对的占预测为正例的比例)

召回率 = TP / (TP+FN):预测为正例的那些数据里预测正确的数据个数(有多少正例被识别出来了,预测为正例且预测对的占总正例的比例)

精确率和召回率可能此消彼长,所以引入F1得分,综合考虑准确率和召回率

调和平均

(2)该github代码是跨摄像头还是单摄像头?

(3)视频中的三个数分别是标注的ID,类别,以及 目标检测的过程中计算的置信度(即矩形框框出的物体是真实物体的概率)

(4)一些细节:

目标检测:目标检测是从图片背景中分离出感兴趣的目标,并确定这一目标的描述(类别和位置)

因而检测输出是一个列表,列表的每一项使用一个数据组给出检出目标的类别和位置(常用矩形框的坐标表示)-> yolo系列

 

基于Tracking-by-detection的MOT:先对视频的每一帧进行目标检测,输出矩形框坐标和类别,根据矩形框对目标进行裁剪,得到图像中的所有目标。

然后转化为前后两帧的关联问题,

(5)ID-switch:

因为跟踪的每个对象都是有标注ID的,一个对象在整个跟踪过程中ID应该不变,但是如果跟踪算法不够强大,总会出现一个对象的ID在不同的帧中发生了切换,

这个指标就说明了ID切换的次数,指视频的前一帧图片和后一帧图片中对于相同GT轨迹的预测轨迹ID出现了不同(发生切换),如果ID跟丢,此情况不计算在ID切换中。

这里的t代表的是视频的第t帧图片: