基于k-均值聚类的图像分割_给定一个h * w *d的矩阵featim,其中h和w为原始图像的高度和宽度,d表示图像中每一-程序员宅基地

技术标签: 计算机视觉  

一:实验目的

        通过编程,实现将一幅彩色图像分割为若干个同质区域,即采用K-Means聚类算法来将像素分组从而实现图像分割。在实验中,要分别基于颜色特征和纹理特征实现图像分割,并通过分析比较两种视觉特征在图像分割中的性能。


二:实验设计

本实验设计4个功能函数

2.1生成隶属度矩阵

函数说明

      给定一个h * w *d 的矩阵featIm,其中h 和w 为原始图像的高度和宽度,d 表示图像中每一个像素点所提取的特征向量的维数。给定一个有k 个聚类中心点的矩阵meanFeatures(矩阵维度是k*d),其中每个中心点都是一个d 维的行向量(矩阵的一行),将输入图片中的每个像素映射到其所归属的k-means 某一个中心点去。函数的返回值定义为labelim,labelim 是一个h*w 的整数矩阵,用来表明每一个像素所属的聚类中心标号(1...k)。函数形式:

function [labelIm] = quantizeFeats (featIm, meanFeats)

实现思路

featIm 是一个 d 维矩阵,meanFeats 里面有 k 个中心点,每个中心点有 d 列,利用 kmeans 的思想,依次计算 featIm 中的每一个像素点到 k 个中心点的距离,选取最近的中心点的行号作为该点的标记值进行返回,返回的 labelIm 正好是 h*w 的矩阵。

代码展示

function labelIm = quantizeFeats (featIm, meanFeats)

height = size(featIm, 1);
width = size(featIm, 2);
dimension = size(featIm, 3);

% 计算原始图像 至 meanFeats 的距离,生成隶属度矩阵 labelIm
labelIm = ones(height, width);
for h=1:height
    for w=1:width
       minDis = -1;
       for k=1:size(meanFeats, 1)
           dis = 0;
           for d=1:dimension
               dis = dis + power(featIm(h, w, d) - meanFeats(k, d), 2);
           end
           dis = sqrt(dis);
           if minDis < 0 || dis < minDis
               labelIm(h, w) = k;
               minDis = sqrt(dis);
           end
       end
    end 
end

return

% 给定一个h * w *d 的矩阵featim,其中h 和w 为原始图像的高度和宽度,d 表示图像中每一个像素点所提取的特征向量的维数。
% 给定一个有k 个聚类中心点的矩阵meanFeatures(矩阵维度是k*d),其中每个中心点都是一个d 维的行向量(矩阵的一行),
% 将输入图片中的每个像素映射到其所归属的k-means 某一个中心点去。
% 函数的返回值定义为labelim,labelim 是一个h*w 的整数矩阵,用来表明每一个像素所属的聚类中心标号(1...k)。

2.2生成纹理基元编码集

函数说明

给定一个长度为n 且包含n 个灰度值图像的元胞数组imStack,以及滤波器组bank,基于所有n 个图片的过滤响应样本计算一个纹理基元编码集(如一组量化的滤波器组响应)。注意,元胞数组的特点是数组中的每个元素可以存储不同大小的矩阵,所以允许每张图片有不同的宽和高。其中bank 是一个包含d 个滤波器的m*m*d 矩阵,每个滤波器的大小为m*m,textons 是一个k*d 的矩阵,其中每一行代表一个纹理特征,如一个量化滤波器组的响应。函数形式:

function [textons] = createTextons(imStack, bank, k)

实现思路

imStack 是元胞数组,里面承载的是n 个灰度值图像,此处使用的滤波器组bank是49*49*38的矩阵,它包含38 个总过滤器,其中每个过滤器为49 x 49。首先将每一个灰度值图像使用滤波器组过滤,得到一个r1*c1*38的矩阵,其次把所有图像的过滤响应样本都合并为一个 row*38 的矩阵,再利用kmeans算法将其聚为 k 类,得到的聚类中心就可以作为一个纹理基元编码集。

代码展示

function [textons] = createTextons(imStack, bank, k)

[row, col] = size(imStack);
bankNum = size(bank, 3);

% 用滤波器过滤元胞数组中的n个灰度图,得到n个 bankNum 维的过滤响应样本
% 再将这n个过滤响应样本组合成一个大的样本集 textonsData
textonsData = [];
for i=1:row
    for j=1:col
        im = imStack{i, j};
        im = im2double(im);
        responses = zeros(size(im, 1), size(im, 2), bankNum);
        for r=1:bankNum
            responses(:,:,r)=conv2(im,double(bank(:,:,r)),'same');
        end
        X = reshape(responses, size(responses,1)* size(responses,2), bankNum);
        Xrow = size(X, 1);
        ranX = X(randperm(Xrow, ceil(Xrow/1000)),:);
        textonsData = [textonsData; ranX];
    end
end

% 使用 kmeans 方法聚合出含有k个纹理基元的纹理编码集
[~, textons] = kmeans(textonsData, k);
return;

% 给定一个长度为n 且包含n 个灰度值图像的元胞数组imStack,以及滤波器组bank,
% 基于所有n 个图片的过滤响应样本计算一个纹理基元编码集(如一组量化的滤波器组响应)。
% 其中bank 是一个包含d 个滤波器的m*m*d 矩阵,每个滤波器的大小为m*m,textons 是一个k*d 的矩阵,
% 其中每一行代表一个纹理特征,如一个量化滤波器组的响应。

2.3 构建纹理柱状图

函数说明

给定一张灰度图像,一个滤波器组,一份纹理编码集,构建纹理柱状图。对于每个像素,基于每个纹理在其邻近范围(定义在固定大小的winSize 内的局部窗口)内出现的频率。函数形式:

function [featIm] = extractTextonHists(origIm, bank, textons, winSize)

实现思路

将原始灰度图像origIm,使用滤波器组进行过滤,得到一个r*c*38 的矩阵,计算每个像素点到纹理基元编码集的隶属度矩阵feattexton。然后统计像素点的邻域窗口内,每个纹理基元出现的频率,可以用一个向量表示,设textons 中有 k 个纹理基元,那么这个向量就有k个数据,每个数据即为相应基元出现的频率,再将这个向量作为 featIm 中对应像素点的数据元素返回,就得到了直方图矩阵,即 featIm 为r*c*k 的矩阵。

代码展示

function [featIm] = extractTextonHists(origIm, bank, textons, winSize)

origIm = im2double(origIm);
[row, col] = size(origIm);

% 图像过滤,生成滤波器组响应 responses
bankNum = size(bank, 3);
responses = zeros(row, col, bankNum);
for r=1:bankNum
    responses(:,:,r)=conv2(origIm,double(bank(:,:,r)),'same');
end

% 计算 滤波器组响应 与 纹理基元编码集 的距离,并生成隶属度矩阵 feattexton
X = reshape(responses, size(responses,1)* size(responses,2), bankNum);
dis2textons = dist2(textons, X);
[~, indxtexton] = max(dis2textons);
feattexton = reshape(indxtexton, row, col);

% 图像边界处理
if winSize > 1
    colNumLeft = floor((winSize-1)/2);
    colNumRight = ceil((winSize-1)/2);
    for i=1:colNumLeft
        feattexton = [feattexton(:,1), feattexton];
        feattexton = [feattexton(1,:); feattexton];
    end
    for i=1:colNumRight
        feattexton = [feattexton, feattexton(:,size(feattexton, 2))];
        feattexton = [feattexton; feattexton(size(feattexton, 1), :)];
    end
else
    colNumLeft = 0;
    colNumRight = 0;
end

% 生成纹理柱状图 featIm
featIm = zeros(row, col, size(textons, 1));
for i=(1+colNumLeft):(size(feattexton, 1)-colNumRight)
    for j=(1+colNumLeft):(size(feattexton, 2)-colNumRight)
        window = feattexton((i-colNumLeft):(i+colNumRight), (j-colNumLeft):(j+colNumRight));
        frequency = tabulate(window(:));
        for k=1:size(frequency, 1)
            textonIndex = int64(frequency(k, 1));
            count = int32(frequency(k, 2));
            featIm(i-colNumLeft, j-colNumLeft, textonIndex) = featIm(i-colNumLeft, j-colNumLeft, textonIndex)+count;
        end
    end
end
        
return;

% 给定一张灰度图像,一个滤波器组,一份纹理编码集,构建纹理柱状图。
% 对于每个像素,基于每个纹理在其邻近范围(定义在固定大小的winSize 内的局
% 部窗口)内出现的频率。其中,texton是k*d 的矩阵。

2.4 计算两种图像分割结果

函数说明

给定一个原始图像为h*w*3 的RGB 彩色图像,计算两种图像分割的结果:一个是基于颜色特征的,另外一个是基于纹理特征。基于颜色特征的图像分割采用基于k-means 聚类的算法,其中用于聚类的颜色信息应该是出现在给定的图片中的。而基于纹理特征的图像分割应基于图像纹理基元直方图的k-means 聚类算法。其中:colorLabelIm 和textureLabelIm 是h*w 的矩阵,分别表示基于颜色和基于纹理的分割区域的标签。而numColorRegion 和numTextRegions 分别表示上述两种特征类型指定的理想分割数目,其他的参数如同以上所定义的。函数形式:

function [colorLabelIm, textureLabelIm] = compareSegmentations(origIm, bank, textons, winSize, numColorRegions, numTextureRegions)

实现思路

调用上述方法,计算原始图像 origIm 的颜色分类隶属度矩阵 colorLabelIm,以及 纹理基元分类隶属度矩阵 textureLabelIm。

代码展示

function [colorLabelIm, textureLabelIm] = ...
    compareSegmentations(origIm, bank, textons, winSize, ...
    numColorRegions, numTextureRegions)

origIm = im2double(origIm);

% 获取颜色集,生成基于颜色分割的标签矩阵
colordata = reshape(origIm, size(origIm, 1)*size(origIm, 2), size(origIm, 3));
opts = statset('Display','final','MaxIter',1000);
[~, colorCenter] = kmeans(colordata, numColorRegions, 'Options', opts);
colorLabelIm = quantizeFeats(origIm, colorCenter);

% 获取纹理柱状图,计算纹理特征,生成基于纹理分割的标签矩阵
featIm = extractTextonHists(rgb2gray(origIm), bank, textons, winSize);
featImData = reshape(featIm, size(featIm, 1)*size(featIm, 2), size(featIm, 3));
[~, textureCenter] = kmeans(featImData, numTextureRegions, 'Options', opts);
textureLabelIm = quantizeFeats(featIm, textureCenter);

return


三:实验分析

      写一个脚本文件'segmentMain.m',使用一些图像(dress.jpg,butterfly.jpg 和gumballs.jpg),去调用上面的函数,将图像分割结果展示出来 并分别比较利用颜色特征和纹理特征分割的效果差异。

dress.jpg

以下选取一张图片进行调参分析

3.1 选择不同的参数值

          选择不同的参数值(比如:k,numRegions,winSize,等等)针对每个特征生成一个合理的有分割效果的图。

3.1.1 固定其它参数,改变颜色的理想分割数目

可见,聚类数目过多或过少都会导致很差的聚类效果,使得不是一类的数据都被聚为一类。

3.1.2 固定其它参数,改变纹理的理想分割数目

与上面的颜色分割数一样,这个值应该选适合这幅图像的纹理大小

同时还发现一个问题,即时颜色分割数目不变,但每次的颜色分割结果也有些微不同,这个应该与kmeans聚类方法的初始中心点的选取有关。

3.2 选择纹理编码集的两个不同版本

        选择纹理编码集的两个不同版本:一种纹理基元编码集的计算方法是根据所提供的所有图像进行计算。另一个纹理基元编码集的计算方法是仅计算要分割的单个图像。

使用所有图片生成纹理编码集

使用测试图片生成纹理编码集

综上,效果不相上下,使用测试图片生成的纹理基元集,效果稍微好些。

3.2.1 选择不同的窗口大小

考虑纹理结果展示窗口大小问题,尝试用较小和较大的窗口,来说明选择大小不同的窗口在某些示例图像上会有一些不同的效果。

选择窗口的大小一定要适中,以图像中纹理单元的大小为窗口最为合适。

 

 

 

转:https://blog.csdn.net/Carithine/article/details/79979709?from=singlemessage&isappinstalled=0

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/LucasXu01/article/details/90764759

智能推荐

C#连接OPC C#上位机链接PLC程序源码 1.该程序是通讯方式是CSharp通过OPC方式连接PLC_c#opc通信-程序员宅基地

文章浏览阅读565次。本文主要介绍如何使用C#通过OPC方式连接PLC,并提供了相应的程序和学习资料,以便读者学习和使用。OPC服务器是一种软件,可以将PLC的数据转换为标准的OPC格式,允许其他软件通过标准接口读取或控制PLC的数据。此外,本文还提供了一些学习资料,包括OPC和PLC的基础知识,C#编程语言的教程和实例代码。这些资料可以帮助读者更好地理解和应用本文介绍的程序。1.该程序是通讯方式是CSharp通过OPC方式连接PLC,用这种方式连PLC不用考虑什么种类PLC,只要OPC服务器里有的PLC都可以连。_c#opc通信

Hyper-V内的虚拟机复制粘贴_win10 hyper-v ubuntu18.04 文件拷贝-程序员宅基地

文章浏览阅读1.6w次,点赞3次,收藏10次。实践环境物理机:Windows10教育版,操作系统版本 17763.914虚拟机:Ubuntu18.04.3桌面版在Hyper-V中的刚安装好Ubuntu虚拟机之后,会发现鼠标滑动很不顺畅,也不能向虚拟机中拖拽文件或者复制内容。在VMware中,可以通过安装VMware tools来使物理机和虚拟机之间达到更好的交互。在Hyper-V中,也有这样的工具。这款工具可以完成更好的鼠标交互,我的..._win10 hyper-v ubuntu18.04 文件拷贝

java静态变量初始化多线程,持续更新中_类初始化一个静态属性 为线程池-程序员宅基地

文章浏览阅读156次。前言互联网时代,瞬息万变。一个小小的走错,就有可能落后于别人。我们没办法去预测任何行业、任何职业未来十年会怎么样,因为未来谁都不能确定。只能说只要有互联网存在,程序员依然是个高薪热门行业。只要跟随着时代的脚步,学习新的知识。程序员是不可能会消失的,或者说不可能会没钱赚的。我们经常可以听到很多人说,程序员是一个吃青春饭的行当。因为大多数人认为这是一个需要高强度脑力劳动的工种,而30岁、40岁,甚至50岁的程序员身体机能逐渐弱化,家庭琐事缠身,已经不能再进行这样高强度的工作了。那么,这样的说法是对的么?_类初始化一个静态属性 为线程池

idea 配置maven,其实不用单独下载Maven的。以及设置新项目配置,省略每次创建新项目都要配置一次Maven_安装idea后是不是不需要安装maven了?-程序员宅基地

文章浏览阅读1w次,点赞13次,收藏43次。说来也是惭愧,一直以来,在装环境的时候都会从官网下载Maven。然后再在idea里配置Maven。以为从官网下载的Maven是必须的步骤,直到今天才得知,idea有捆绑的 Maven 我们只需要搞一个配置文件就行了无需再官网下载Maven包以后再在新电脑装环境的时候,只需要下载idea ,网上找一个Maven的配置文件 放到 默认的 包下面就可以了!也省得每次创建项目都要重新配一次Maven了。如果不想每次新建项目都要重新配置Maven,一种方法就是使用默认的配置,另一种方法就是配置 .._安装idea后是不是不需要安装maven了?

奶爸奶妈必看给宝宝摄影大全-程序员宅基地

文章浏览阅读45次。家是我们一生中最重要的地方,小时候,我们在这里哭、在这里笑、在这里学习走路,在这里有我们最真实的时光,用相机把它记下吧。  很多家庭在拍摄孩子时有一个看法,认为儿童摄影团购必须是在风景秀丽的户外,即便是室内那也是像大酒店一样...

构建Docker镜像指南,含实战案例_rocker/r-base镜像-程序员宅基地

文章浏览阅读429次。Dockerfile介绍Dockerfile是构建镜像的指令文件,由一组指令组成,文件中每条指令对应linux中一条命令,在执行构建Docker镜像时,将读取Dockerfile中的指令,根据指令来操作生成指定Docker镜像。Dockerfile结构:主要由基础镜像信息、维护者信息、镜像操作指令、容器启动时执行指令。每行支持一条指令,每条指令可以携带多个参数。注释可以使用#开头。指令说明FROM 镜像 : 指定新的镜像所基于的镜像MAINTAINER 名字 : 说明新镜像的维护(制作)人,留下_rocker/r-base镜像

随便推点

毕设基于微信小程序的小区管理系统的设计ssm毕业设计_ssm基于微信小程序的公寓生活管理系统-程序员宅基地

文章浏览阅读223次。该系统将提供便捷的信息发布、物业报修、社区互动等功能,为小区居民提供更加便利、高效的服务。引言: 随着城市化进程的加速,小区管理成为一个日益重要的任务。因此,设计一个基于微信小程序的小区管理系统成为了一项具有挑战性和重要性的毕设课题。本文将介绍该小区管理系统的设计思路和功能,以期为小区提供更便捷、高效的管理手段。四、总结与展望: 通过本次毕设项目,我们实现了一个基于微信小程序的小区管理系统,为小区居民提供了更加便捷、高效的服务。通过该系统的设计与实现,能够提高小区管理水平,提供更好的居住环境和服务。_ssm基于微信小程序的公寓生活管理系统

如何正确的使用Ubuntu以及安装常用的渗透工具集.-程序员宅基地

文章浏览阅读635次。文章来源i春秋入坑Ubuntu半年多了记得一开始学的时候基本一星期重装三四次=-= 尴尬了 觉得自己差不多可以的时候 就吧Windows10干掉了 c盘装Ubuntu 专心学习. 这里主要来说一下使用Ubuntu的正确姿势Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的开源GNU/Linux操作系统,Ubuntu 是基于DebianGNU/Linux,支..._ubuntu安装攻击工具包

JNI参数传递引用_jni引用byte[]-程序员宅基地

文章浏览阅读335次。需求:C++中将BYTE型数组传递给Java中,考虑到内存释放问题,未采用通过返回值进行数据传递。public class demoClass{public native boolean getData(byte[] tempData);}JNIEXPORT jboolean JNICALL Java_com_core_getData(JNIEnv *env, jobject thisObj, jbyteArray tempData){ //resultsize为s..._jni引用byte[]

三维重建工具——pclpy教程之点云分割_pclpy.pcl.pointcloud.pointxyzi转为numpy-程序员宅基地

文章浏览阅读2.1k次,点赞5次,收藏30次。本教程代码开源:GitHub 欢迎star文章目录一、平面模型分割1. 代码2. 说明3. 运行二、圆柱模型分割1. 代码2. 说明3. 运行三、欧几里得聚类提取1. 代码2. 说明3. 运行四、区域生长分割1. 代码2. 说明3. 运行五、基于最小切割的分割1. 代码2. 说明3. 运行六、使用 ProgressiveMorphologicalFilter 分割地面1. 代码2. 说明3. 运行一、平面模型分割在本教程中,我们将学习如何对一组点进行简单的平面分割,即找到支持平面模型的点云中的所有._pclpy.pcl.pointcloud.pointxyzi转为numpy

以NFS启动方式构建arm-linux仿真运行环境-程序员宅基地

文章浏览阅读141次。一 其实在 skyeye 上移植 arm-linux 并非难事,网上也有不少资料, 只是大都遗漏细节, 以致细微之处卡壳,所以本文力求详实清析, 希望能对大家有点用处。本文旨在将 arm-linux 在 skyeye 上搭建起来,并在 arm-linux 上能成功 mount NFS 为目标, 最终我们能在 arm-linux 里运行我们自己的应用程序. 二 安装 Sky..._nfs启动 arm

攻防世界 Pwn 进阶 第二页_pwn snprintf-程序员宅基地

文章浏览阅读598次,点赞2次,收藏5次。00为了形成一个体系,想将前面学过的一些东西都拉来放在一起总结总结,方便学习,方便记忆。攻防世界 Pwn 新手攻防世界 Pwn 进阶 第一页01 4-ReeHY-main-100超详细的wp1超详细的wp203 format2栈迁移的两种作用之一:栈溢出太小,进行栈迁移从而能够写入更多shellcode,进行更多操作。栈迁移一篇搞定有个陌生的函数。C 库函数 void *memcpy(void *str1, const void *str2, size_t n) 从存储区 str2 _pwn snprintf

推荐文章

热门文章

相关标签