计算机视觉分类主要包括图像分类、目标检测、语义分割、实例分割和关键点检测五大类,每类技术解决不同的视觉任务。
- 图像分类:识别图像中的主要对象类别,如判断一张图片是猫还是狗。
- 目标检测:不仅识别物体类别,还定位其在图像中的位置,通常用边界框标注。
- 语义分割:对图像中每个像素进行分类,区分不同物体或背景,但不区分同类物体的不同实例。
- 实例分割:结合目标检测和语义分割,区分同类物体的不同个体,如识别多只猫并分别标注。
- 关键点检测:识别物体的特定特征点,如人脸中的眼睛、鼻子位置,常用于姿态估计。
这些分类技术广泛应用于安防、医疗、自动驾驶等领域,推动人工智能在视觉任务中的高效应用。