分层聚类过程 发表评论(0) 编辑词条
既可以对变量也可以对观测进行聚类
原理:先将n和变量/观测看作不同的n类,然后将性质相近的两类合并为1类,再从这n-1类中找出相似的两类合并成一类,依次类推下去,直到都合并成为1类。
使用者根据具体的问题和聚类的结果来决定该聚为几类。
在这种方法中,一旦一个变量/观测被划分在一个类别中,以后它的分类结果不会再更改
变量可以是连续型或者是分类变量,可以是定量的,二分类的或者是计数的
变量选择:在进行聚类之前,应该从专业角度考虑尽量删除对分类不起作用的变量,并非变量越多约好,原则上各个变量直接要有显著差别
共线性问题,会使得一些变量的权重高于其他的变量,可以通过提取主成份,然后再聚类的方法
在做聚类分析之前需要对变量进行标准化处理,否则变异大的变量会严重影响距离计算结果
尽量避免异常值的影响
一般来说分为2-8类比较合适
原理:先将n和变量/观测看作不同的n类,然后将性质相近的两类合并为1类,再从这n-1类中找出相似的两类合并成一类,依次类推下去,直到都合并成为1类。
使用者根据具体的问题和聚类的结果来决定该聚为几类。
在这种方法中,一旦一个变量/观测被划分在一个类别中,以后它的分类结果不会再更改
变量可以是连续型或者是分类变量,可以是定量的,二分类的或者是计数的
变量选择:在进行聚类之前,应该从专业角度考虑尽量删除对分类不起作用的变量,并非变量越多约好,原则上各个变量直接要有显著差别
共线性问题,会使得一些变量的权重高于其他的变量,可以通过提取主成份,然后再聚类的方法
在做聚类分析之前需要对变量进行标准化处理,否则变异大的变量会严重影响距离计算结果
尽量避免异常值的影响
一般来说分为2-8类比较合适
附件列表
→如果您认为本词条还有待完善,请 编辑词条
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0
收藏到:
同义词: 暂无同义词
关于本词条的评论 (共0条)发表评论>>