K-means聚类方法
就是把空间内点,分成K类。同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
用均值来代表类中心,并用于衡量与新点的距离。
初始值:
根据先验知识找到K个均值,做迭代初始值。
迭代公式:
1:从n个数据对象中选择k个对象作为初始聚类中心
2:将剩下的n-k个数据对象,按照他们和初始的k个值之间的距离大小,分配给与其最近的聚类。
3:计算形成的k个新聚类的聚类中心(该聚类中所有对象的均值)
4:重复2
5:类中心不再摆动,或者摆动幅度很小,趋于稳定,则终止。
测准函数一般使用均方差。
bin/mahout kmeans \
-i <input vectors directory> \
-c <input clusters directory> \
-o <output working directory> \
-k <optional number of initial clusters to sample from input vectors> \
-dm <DistanceMeasure> \
-x <maximum number of iterations> \
-cd <optional convergence delta. Default is 0.5> \
-ow <overwrite output directory if present>
-cl <run input vector clustering after computing Canopies>
-xm <execution method: sequential or mapreduce>
注意: 当-k被指定的时候,-c目录下的所有聚类都将被重写,将从输入的数据向量中随机抽取-k个点作为初始聚类的中心。
分享到:
相关推荐
基于K-means聚类算法的图像分割 算法的基本原理: 基于K-means聚类算法的图像分割以图像中的像素为数据点,按照指定的簇数进行聚类,然后将每个像素点以其对应的聚类中心替代,重构该图像。 算法步骤: ①随机选取...
以简单的代码快速实现k-means聚类方法,以20个2维样本数据为例
但是,传统的K-means聚类算法在选取初始中心和度量相似性上有一定缺陷。针对传统的K-means算法中存在的问题,本文对原有的方法进行了改进。第一,在初始化聚类中心时选取了一种优化的方法作为初始聚类中心,替代原有的...
基于 K-means 聚类算法的图像区域分割,首先从数据样本种选取K个点作为初始聚类中心,其次计算各个样本到聚类的距离,把样本归到离它最近的那个聚类中心所在的累,计算新形成的每个聚类的数据对象的平均值来得到新的...
针对当前多区域物流中心选址需建立配送中心个数不定、位置、覆盖范围不明的问题,本文提出了一种改进的k-means聚类算法,以城市经济引力模型为基础,将城市运输距离与居民消费能力的指标相结合,重新定义对象之间...
主要介绍了详解Java实现的k-means聚类算法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
基于k-means聚类算法的研究,黄韬,刘胜辉,本文首先分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机��
用动画效果 帮助新手理解K-means聚类,有数据,有动画
K-means聚类算法的性能依赖于距离度量的选择,k-means算法将欧几里德距离作为最常用的距离度量方法。欧氏距离认为所有属性在聚类中作用是相同的,但是这种距离度量方法并不能准确反映样本间的相异性。针对这种不足,...
利用K-means聚类法将灰度图像划分成聚类分区, 在每个聚类分区应用最小平方法least-squares最小化二值半色调图像和原始灰度级图像之间的平方误差, 所构造的半色调算法与基于模型的最小平方法LSMB算法相比, 随着聚类...
实验五 K-Means聚类算法.ipynb
深大计软_最优化方法_实验1:K-Means聚类之Python实现手写数字图像MNIST分类
主要介绍了Python用K-means聚类算法进行客户分群的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
将流形距离引入K-means聚类算法中,对于具有流形结构的数据集有很好的聚类效果,流形距离计算参数的设定充分考虑了全局和局部一致性。
国信证券_20161205_金融工程专题研究:基于k-means聚类的多因子特征检验.pdf
提供了k-means多维数据的聚类分析matlab源代码代码
K-MEANS聚类算法的实现K-MEANS聚类算法的实现
1.版本:matlab2019a,不会运行可私信 2.领域:【数据聚类】 3.内容:基于k-means聚类算法实现三维数据分类含Matlab源码 4.适合人群:本科,硕士等教研学习使用
(带注释)基于K-means聚类算法的图像区域分割.zip,MATLAB实现,详情可以参考:https://blog.csdn.net/didi_ya/article/details/115376184