| 2,607 | 61 | 89 |
| 下载次数 | 被引频次 | 阅读次数 |
指标之间的高度相关性及其重要性差异导致了传统聚类分析方法往往无法获得良好的分类效果。本文在对传统聚类分析方法及其改进方法的局限性展开探讨的基础上,运用数学方法重构了分类定义中的距离概念,通过定义自适应赋权的主成分距离为分类统计量,提出一种新的改进的主成分聚类分析方法——加权主成分距离聚类分析法。理论研究表明,加权主成分距离聚类分析法系统集成了已有聚类分析方法的优点,有充分的理论基础保证其科学合理性。仿真实验结果显示,加权主成分距离聚类分析法能够有效解决已有聚类分析方法在特定情形下的失真问题,所得分类效果更为理想。
Abstract:Traditional clustering analysis method is often unable to obtain the good classification result because of correlations among indexes and difference in indexes ' importance. This paper discusses the limitations of traditional clustering analysis method and the various improved methods,and reconstructs the concept of distance in classification by using the mathematical methods. Through defining the principal component distance of objective weighting as the classification statistic,it puts forward a new improved principal component clustering analysis method——the clustering analysis method of weighted principal component distance. Theoretical study shows that the new method is scientific rational and integrates the advantages of existing methods. The simulation result shows that the new method can effectively solve the problem of the failure of the existing clustering analysis methods in the specific circumstances,and has satisfactory classification effect.
[1]刘瑞元.加权欧氏距离及其应用[J].数理统计与管理,2002(5):17-19.
[2]武洁,陈忠琏.我国各地区人口素质差异的主成分和聚类分析[J].数理统计与管理,1998(6):42-48.
[3]王晓龙,刘笑明,李同升.主成分分析法、聚类分析法在旅游观光农业空间分区中的应用——以西安市为例的研究[J].数理统计与管理,2005(4):6-13.
[4]孙锐,石金涛.基于因子和聚类分析的区域创新能力再评价[J].科学学研究,2006(6):985-990.
[5]王庆丰,党耀国,王丽敏.基于因子和聚类分析的县域经济发展研究——以河南省18个县(市)为例[J].数理统计与管理,2009(3):495-501.
[6]王德青,朱建平,谢邦昌.主成分聚类分析有效性的思考[J].统计研究,2012(11):84-87.
[7]朱建平,王德青,方匡南.中国区域创新能力静态分析——基于自适应赋权主成分聚类模型[J].数理统计与管理,2013(5):761-768.
[8]王德青,朱建平,王洁丹.基于自适应权重的函数型数据聚类方法研究[J].数理统计与管理,2015(1):84-92.
[9]王德青,刘晓葳,朱建平.基于自适应迭代更新的函数型数据聚类方法研究[J].统计研究,2015(4):91-96.
[10]Charytanowicz M,et al.Complete gradient clustering algorithm for features analysis of x-ray images[C].Information technologies in biomedicine.Berlin:Springer Berlin Heidelberg,2010:15-24.
基本信息:
DOI:10.19343/j.cnki.11-1302/c.2016.11.014
中图分类号:F224
引用信息:
[1]吕岩威,李平.一种加权主成分距离的聚类分析方法[J].统计研究,2016,33(11):102-108.DOI:10.19343/j.cnki.11-1302/c.2016.11.014.
基金信息:
国家社会科学基金项目“基于产业模块化的产业融合机制、测度及效应研究”(13BJY003);; 山东省自然科学基金项目“山东战略性新兴产业集聚布局、关联效应与比较优势研究”(ZR2014GP005);; 山东省社会科学基金项目“地方政府竞争格局下的山东战略性新兴产业发展路径研究”(14DJJJ04)资助
2016-11-15
2016-11-15