全站文章列表 | 收藏本站 | RSS订阅 SPSS教程|答疑|案例|训练营
SPSS答疑​答疑26:如何看懂聚类分析的树状图?

​答疑26:如何看懂聚类分析的树状图?
时间:2016年04月06日 | 栏目:SPSS答疑 | 评论:0 | 点击: 2869


  • SPSS聚类分析提供两种类别图形的输出,第一种是软件默认的“冰柱图”,形状类似于冬天屋檐上垂下的冰柱,因此得名。第二种是“树状图”,在新版本软件中也称谱系图,像一个横着生长的树。

    冰柱图虽然是软件默认输出,但实际上操作者们却更愿意看树状图。树状图直观的展示了聚类的整个过程,问题是,有读者说看不明白树状图。


    这一期分享一个看懂SPSS聚类分析树状图的方法。


    首先,这棵树是从左向右横着生长的,最左侧罗列出所有聚类类别,像树的根系,可以说,你有多少聚类变量或个案,就有多少个根系类,根系类生长聚合,逐渐向右侧生长出若干枝干类,继续生长,最后合并为两类。也就是说,每一条横线,从根系开始就是一类,横线不断合并,类别也相应高度集中。


    第二,图形的顶部有一行数字,它是这颗树的横轴,数字是各类别的相对距离,是按距离比例重新设定的结果。这个类的相对距离,能大概告诉我们类别之间距离的变化。


    第三,读懂这颗树,你需要一把尺子,与从左向右的横线垂直90度放下。此时,横线(一条线就是一个类别)被尺子截断,这些端点的个数就是该相对距离下的类别数目。

    以上图为例,如果我们是分成两类,请看右侧红线,“上海”独自成为一个类别,其他城市是第二个类别;如果我们想分成三类,那么这三类的情况是,“上海”独为一类,“天津、北京、广东、浙江”四个城市是第二类,第三类则包括剩余的其他城市。

    再进一步,两条红线之间的距离,告诉我们聚为两类和三类,其类中间距离发生了多大的变化,我们可以尝试用这种相对距离变化的幅度来初步判断聚类的效果。


    有读者可能又要问了,到底聚为几个类别比较合适?


    那么我奉劝大家一句,不管是冰柱图还是树状图,它更多的是为我们充分展示聚类的整个过程,让我们从可视化的层面了解到哪些个案被归聚为一类,最终聚为几个类别,这需要你依据对不同类的特征的区隔程度来决定。


    你自学SPSS时,有遇到什么疑问吗?扫码提交,数据小兵会及时给出答复。谢谢


    声明:数据小兵博客SPSS答疑系列文章精编版已正式上线百度阅读平台,作为一本电子书与读者付费见面了,鉴于版权问题,本博客连载的答疑系列文章未经作者授权,请勿转载,谢谢大家。


    同类荐读:SPSS答疑  聚类分析  树状图 

    本文来自:数据小兵博客

    本文地址:http://datasoldier.net/post/dayi26.html

    版权说明:如非注明,本站文章均为 数据小兵博客 原创,转载请注明出处和附带本文链接。

    友荐云推荐
  • 额 本文暂时没人评论 来添加一个吧

    发表评论

    必填

    选填

    选填

    必填

    ◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。