7.1 目标检测的概念
7.1 目标检测的概念
目标检测简单来讲就是目标识别和目标定位,在《web安全之机器学习入门》和《web安全之深度学习实战》中,我们介绍了如何使用深度学习识别手写数字,如何使用tensorflow或者keras平台预训练好的模型,识别小猪和猫。如图7-1所示,在一个典型的基于卷积神经网络的目标识别任务中,通过卷积、池化、全连接等层的计算,把一个输入的图片最终识别为猫。
图7-1 典型的目标识别任务
目标检测任务除了要完成图像的识别,还需要能够定位物体的位置。如图7-2所示,目标检测模型不光可以识别图中的猫,还可以准确地使用方框从背景中框出猫的范围。
图7-2 典型的目标检测任务
最典型的标记物体的范围就是使用方框,把方框左上角的原点的坐标记为(x,y),方框的宽为w,高为h,那么整个方框的坐标为(x,y,w,h),如图7-3所示。
图7-3 使用方框标记物体范围
在实际使用中,如图7-4所示,需要从背景图片中识别出多个物体,这个可以当作单物体识别的能力延伸。
图7-4 从背景图片中检测多个物体
在对物体定位精度要求不高的领域,基于方框的物体定位方式很好地表示出了物体的范围和位置。但是在部分领域,比如智能驾驶、智能安防领域,需要能够以更高的精度来表示物体的范围和位置。如图7-5所示,图像语义分割就可以非常准确地勾画出物体的轮廓,并识别出图像中的内容,标注出人和车的范围。
图7-5 典型的图像语义分割
目标检测简单来讲就是目标识别和目标定位,在《web安全之机器学习入门》和《web安全之深度学习实战》中,我们介绍了如何使用深度学习识别手写数字,如何使用tensorflow或者keras平台预训练好的模型,识别小猪和猫。如图7-1所示,在一个典型的基于卷积神经网络的目标识别任务中,通过卷积、池化、全连接等层的计算,把一个输入的图片最终识别为猫。
图7-1 典型的目标识别任务
目标检测任务除了要完成图像的识别,还需要能够定位物体的位置。如图7-2所示,目标检测模型不光可以识别图中的猫,还可以准确地使用方框从背景中框出猫的范围。
图7-2 典型的目标检测任务
最典型的标记物体的范围就是使用方框,把方框左上角的原点的坐标记为(x,y),方框的宽为w,高为h,那么整个方框的坐标为(x,y,w,h),如图7-3所示。
图7-3 使用方框标记物体范围
在实际使用中,如图7-4所示,需要从背景图片中识别出多个物体,这个可以当作单物体识别的能力延伸。
图7-4 从背景图片中检测多个物体
在对物体定位精度要求不高的领域,基于方框的物体定位方式很好地表示出了物体的范围和位置。但是在部分领域,比如智能驾驶、智能安防领域,需要能够以更高的精度来表示物体的范围和位置。如图7-5所示,图像语义分割就可以非常准确地勾画出物体的轮廓,并识别出图像中的内容,标注出人和车的范围。
图7-5 典型的图像语义分割