帖子

day18学习笔记7/31

[复制链接]
  • TA的每日心情
    开心
    2020-7-16 09:47
  • 签到天数: 1 天

    [LV.1]初来乍到

    1710 189****8161 发表于 2020-7-31 20:38:50 1#
    分级聚类(hierarchical clustering)方法又称为层次聚类法,是最常用的聚类方法之一。依据研究对象(样品或指标)的特征,对其进行分类,减少研究对象的数目。
    在归类的过程中可以从N类到1类逐级地进行类别划分,求得一系列类别数从多到少,然后根据一定的指标选择中间某个适当的划分方案作为聚类的结果。
    具体步骤
    1.     初始时每个样本自成一个类
    2.     合并:通过两个类之间的相似性度量,按照一定标准(相似距离)将两个类合并为一类,记录下这两个类之间的距离,其余类保持不变。
    3.     一旦有了一个子集群,要将它与其他行、列、子集群进行比较(重复2),如果可能,直到所有样本合并到一个类中。
    聚类的结果称为系统树图(dendrogram),图中最底层的每个节点都是一个样本,树枝的长度表达了类与类之间相似的距离关系。求相似的距离可用欧几里德距离、曼哈顿距离等。