ee.Clusterer.wekaKMeans

使用 k-means 算法对数据进行聚类。可以使用欧几里得距离(默认)或曼哈顿距离。如果使用曼哈顿距离,则形心将计算为分量中位数,而不是平均值。如需了解详情,请参阅以下内容:

D. Arthur, S. Vassilvitskii:k-means++:精心选择初始点的优势。In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.

用法返回
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed)聚类器
参数类型详细信息
nClusters整数聚类数量。
init整数,默认值:0要使用的初始化方法。0 = 随机,1 = k-means++,2 = canopy,3 = farthest first。
canopies布尔值,默认值:false使用 canopy 来减少距离计算次数。
maxCandidates整数,默认值:100使用 Canopy 聚类时,在内存中保留的候选 Canopy 的最大数量。T2 距离加上数据特征,将决定在执行定期和最终剪枝之前形成多少个候选 Canopy,这可能会导致内存消耗过高。此设置可避免大量候选树冠消耗内存。
periodicPruning整数,默认值:10000使用 Canopy 聚类时,修剪低密度冠层的频率。
minDensity整数,默认值:2使用冠层聚类时,低于此值的冠层将在定期剪枝期间被剪除。
t1浮点数,默认值:-1.5使用 Canopy 聚类时要使用的 T1 距离。如果该值小于 0,则将其视为 T2 的正乘数。
t2浮点数,默认值:-1使用 Canopy 聚类时要使用的 T2 距离。值 < 0 会导致系统使用基于属性标准差的启发式方法。
distanceFunction字符串,默认值:“Euclidean”要使用的距离函数。选项包括:欧几里得和曼哈顿。
maxIterations整数,默认值:null迭代次数上限。
preserveOrder布尔值,默认值:false保留实例顺序。
fast布尔值,默认值:false使用截止值,实现更快的距离计算。停用平方误差/距离的计算/输出。
seed整数,默认值:10随机种子。