图2欧氏空间聚类结果
实验2:采用本文的核函数二次聚类算法。聚类参数:蚂蚁数量AntCount=16,最大迭代次数T=10,网格数g=25,k1=0.1,k2=0.3,η=0.07,β=3.5,α=400,γ=0.2;核参数 =96.15。将150朵花的数据散布到25x25的阵列空间后第一次聚类得到的结果如图3示。

图3核函数第一次聚类结果
图4第二次聚类结果
在图3中,簇的数目较多,不容易判断出有3簇,但每簇内同类对象较集中。我们采用马赛克法把第一次聚类结果压缩成13x13的矩阵,再进行二次聚类。聚类参数:物体个数ItemNumber=28,蚂蚁数ant=10,网格grid=13,η=0.07,β=3.5,α=400,γ=0.2,k1=0.15,k2=0.35,迭代次数10。图4为第二次聚类结果。我们可以看到数据被聚类成了3大部分,与鸢尾花数据集的3类基本符合。
(五)结论:
核函数二次聚类算法适合于多属性(维)多对象的聚类。将高维数据用核函数映射到一维空间得到核距离值,每个对象对应一个核距离值。将对象撒到平面矩阵中,用ACluster方法使用较小的阈值聚类,在大空间得到规模较小但内部相似度很高的簇,然后将大空间的信息压缩到小空间,再用不同的聚类相关的参数进行第二次聚类,得到较接近真实情况的结果。
参考文献
1 Han J W,Kamber M.数据挖掘:概念与技术[M].北京:机械工业出版社,2008:251-300
2 Deneubourg J L, Goss S, Franks N. The dynamics of collective sorting: robot-like ant and ant-likerobot[C]. Proceedings first conference on simulation of adaptive behavior: fromanimals to animats. Cambridge: MITPress, 1991:356-363.
3 Vitorino Ramos, Fernando Muge, Pedro Pina. Self-Organized Data and Image Retrieval as a Consequence ofInter-Dynamic Synergistic Relationships in Artificial Ant Colonies [C], 2ndInt. Conf. on Hybrid Intelligent Systems, IOS Press, 2002 Vol. 87:500-509.
4 张冰,孔锐,一种支持向量机的组合核函数[J],计算机应用,第27卷第1期,文章编号:1001-9081(2007)01-0044-03
5 徐燕子,覃华.用核空间距离聚类约简大规模SVM训练集[J].微计算机信息, 2010, 15:197-198.
6 http://archive.ics.uci.edu/ml/machine-learning-databases/iris/. 2/2 首页 上一页 1 2 |