自己找教学场景相关github目标识别代码研读（10.21~10.28）-526互联

任务：

1、解决上次老师问的一些问题？

（1）上次老师提到F1得分，再总结一下：

混淆矩阵

TP：预测正例，实际正例（预测对）

FN：预测负例，实际正例（预测错）

FP：预测正例，实际负例（预测错）

TN：预测负例，实际负例（预测对）

精确率 = TP / (TP+FP) ：预测为正例的那些数据里预测正确的数据个数（预测为正例的有多少预测对了，预测为正例且预测对的占预测为正例的比例）

召回率 = TP / (TP+FN)：预测为正例的那些数据里预测正确的数据个数（有多少正例被识别出来了，预测为正例且预测对的占总正例的比例）

精确率和召回率可能此消彼长，所以引入F1得分，综合考虑准确率和召回率

调和平均

（2）该github代码是跨摄像头还是单摄像头？

（3）视频中的三个数分别是标注的ID，类别，以及目标检测的过程中计算的置信度（即矩形框框出的物体是真实物体的概率）

（4）一些细节：

目标检测：目标检测是从图片背景中分离出感兴趣的目标，并确定这一目标的描述（类别和位置）

因而检测输出是一个列表，列表的每一项使用一个数据组给出检出目标的类别和位置（常用矩形框的坐标表示）-> yolo系列

基于Tracking-by-detection的MOT：先对视频的每一帧进行目标检测，输出矩形框坐标和类别，根据矩形框对目标进行裁剪，得到图像中的所有目标。

然后转化为前后两帧的关联问题，

（5）ID-switch：

因为跟踪的每个对象都是有标注ID的，一个对象在整个跟踪过程中ID应该不变，但是如果跟踪算法不够强大，总会出现一个对象的ID在不同的帧中发生了切换，

这个指标就说明了ID切换的次数，指视频的前一帧图片和后一帧图片中对于相同GT轨迹的预测轨迹ID出现了不同（发生切换），如果ID跟丢，此情况不计算在ID切换中。

这里的t代表的是视频的第t帧图片：