DeepSort数据集制作需通过数据收集、标注、格式化等步骤完成,核心流程包括数据获取、命名规范定义、ReID特征兼容性处理以及目录结构调整。
-
数据收集与初步整理:可从公开平台(如Market-1501、Kaggle或百度飞桨)下载现成数据集,或通过摄像头录制视频后使用标注工具(如DarkLabel)提取图像。若使用视频源需先翻转竖屏视频为横屏格式适配工具兼容性。收集后按人物ID和摄像头场景分类,删除尺寸过小的图像(如低于128x128像素需通过Python脚本调整)。
-
命名与目录结构标准化:需遵循ReID任务要求调整文件名(如示例0001_c1s1_000151_01.jpg需包含ID、摄像头、帧号等信息)并分离训练集与测试集。将训练文件移至train目录,测试文件移至test目录,确保YOLOv5+DeepSort联合训练时能被torchvision正确读取,避免路径错误报错。
-
ReID特征兼容性处理:在生成数据集时,需确保标注文件与ReID模型要求的输入格式一致。例如修改model.py中的类别参数以匹配数据集中身份数量(Market-1501默认751类),并检查深度排序模块能否读取图像路径。部分场景需手动添加类别映射文件支持多分类任务。
-
标注工具与质量控制:使用批量标注工具时需校验边界框坐标是否完整,异常值(如空值、负值)需剔除。可通过脚本自动补全遗漏字段,并对检测结果进行二次审核(如随机抽样检查标记准确性)。
完成以上步骤后,训练后的DeepSort模型可在视频中实现跨摄像头的目标跟踪与身份识别,提升轨迹连续性和特征区分度。制作完整数据集需整合图像预处理、标注脚本自动化及模型适配性测试,以确保端到端流程的稳定性。