机器学习:图像语义分割

阅读量 ,评论量

定义

根据灰度、颜色、纹理、形状等特征,将数字图像划分成几个互不相交的区域的过程称为图像分割;是由图像处理到图像分割的关键步骤。

传统算法

基于阈值

基本思想为根据图像的灰度分布来确定一个或多个灰度阈值,进而将图像进行划分。

该方法的关键为确定一个函数来求解最佳灰度阈值。

基于边缘

考虑到分割得到的区域边缘通常会发生某些特征(灰度、颜色、纹理、形状等)的突变,又由经验得知,边缘的灰度值阶跃型(一阶导数的极值点,可用Roberts算子、Prewitt算子或Sobel算子求得)或屋顶型(函数的极值点)的突变,故该方法通常采用基于灰度值的边缘检测。

基于区域

同一区域内的图像特征必有一定的相似性,故可通过设计某种相似性准则来将图像划分为不同的区域。

种子区域生长法

从代表不同生长区域的种子像素开始,将种子像素邻域里符合一定条件的像素合并到种子像素所代表的生长区域中,并将新添加的像素也作为种子像素开始新的合并过程,直到找不到符合条件的像素为止,属于 bottom-up 的方法。

该方法的关键为初始种子像素的选择和作为条件的生长准则。

区域分裂合并法

首先将图像任意分割成互不相交的几个区域,然后按照一定的条件将这些区域进行分裂或者合并从而完成图像的分割,属于 top-down 的方法。

分水岭法

一种基于拓扑理论的形态学的分割方法,常结合距离变换实现图像的分割,详见demo: Image Segmentation with Distance Transform and Watershed Algorithm

基于图论

待加: https://blog.csdn.net/zhangjunp3/article/details/79672098

基于能量泛函

待加: https://blog.csdn.net/zhangjunp3/article/details/79672098

深度神经网络算法

全卷积网络(FCN)

全卷积网络是从抽象的特征中恢复出每个像素所属的类别,即从图像级别的分类进一步延伸到像素级别的分类。

将最后的输出是1000张heatmap经过upsampling变为原图大小的图片,然后通过逐个像素地求其在1000张图像该像素位置的最大数值描述(概率)作为该像素的分类。