两阶段密度意识子空间聚类模型
【作者】
李长路
[1,2] ;
王劲林
[1] ;
郭志川
[1] ;
潘梁
[1]
【关键词】
数据挖掘
子空间聚类
网格聚类
高维数据
【摘要】针对网格聚类方法在高维子空间聚类中网格规模随着维度急剧升高的问题,以及差别阈值方法引入干扰小聚簇的问题,提出一种具有两个网格划分阶段的密度意识子空间聚类模型。该模型第一阶段采用粗网格找出可能存在聚类的子空间区域,第二阶段在这些区域中进行等效精度更高的网格划分并找出所有致密单元。该模型在两个阶段处理的网格规模均远低于密度意识子空间聚类模型在相同划分精度下的网格规模,同时利用第一阶段对网格空间的筛选作用降低小聚簇干扰,提高聚类质量。合成数据集实验表明:该模型聚类精准率和查全率性能明显优于原模型;基于真实数据集实验,相比一次砑1分模型,该模型以损失0.4%数据点的代价提高输出聚类密度19.4%,聚类质量大幅提升。
上一篇:采用万有引力定律自动确定类数的K均值算法
下一篇:亮色分离的饱和图像校正方法