科学与技术

聚类分析

统计数据
验证引用
尽管已经尽一切努力跟随引文样式规则,可能会有一些差异。请参考适当的样式手册或其他来源的如果你有任何问题。
选择引用样式
反馈
修正?更新?遗漏?让我们知道如果你有建议改进这篇文章(需要登录)。
谢谢你的反馈

我们的编辑器将检查你提交并决定是否修改这篇文章。

打印打印
请选择哪些部分你想打印:
验证引用
尽管已经尽一切努力跟随引文样式规则,可能会有一些差异。请参考适当的样式手册或其他来源的如果你有任何问题。
选择引用样式
反馈
修正?更新?遗漏?让我们知道如果你有建议改进这篇文章(需要登录)。
谢谢你的反馈

我们的编辑器将检查你提交并决定是否修改这篇文章。

聚类分析,在统计数据,的一组工具和算法用于分类不同的对象分组,这样两个对象之间的相似性最大,如果他们属于同一个组和最小。在生物学聚类分析是一个重要的工具分类(现存的和已灭绝的生物的分类)。在临床医学,它可以用来识别患者疾病的常见原因,患者应该接受同样的治疗,或者患者应该相同级别的对治疗的反应。在流行病学聚类分析有许多用途,如发现有意义的区域集团,社区或社区涉及类似的流行病学资料,许多变量和自然分组不存在。一般来说,当一个人需要对大量的信息进行分类成少量的有意义的分类,聚类分析可能是有用的。

研究人员经常面对的任务排序观测数据成有意义的结构。聚类分析是一种归纳的勘探技术,它揭示结构没有解释其存在的理由。存活率存在,而不是一个假设检验,技术。不像判别分析,对象分配给现有组织分配的统计规则的基础上,聚类分析生成的组或发现一个隐藏的结构组内的数据。

分类的方法

在第一次广泛的方法中,聚类分析技术可以分为等级,如果结果分组有越来越多的嵌套类,类似于一个系统分类,或无,如果结果表示为一个独特的分区整个组对象。

分层算法可以分裂的或凝结的。分裂的方法始于所有情况下在一个集群中。该集群逐渐分解为越来越小的簇。烧结的技术通常与集群成员都先后开始融合,直到形成一个大的集群。在最初的步骤中,最低的两个物体距离(或最高相似)组合成一个集群。在下一步中,最低的物体距离的前两个是识别和研究。如果它是接近第四个对象比前两个中的任何一个,第三个和第四个对象成为第二个集群两个案例;否则,第三个对象是包含在第一个集群。重复该过程,向现有集群添加情况下,创建新集群,或结合那些已经出现,直到每个对象被审查分配一个集群中,或者是一个单独的集群本身。在过程的每一步,形成不同的分区中嵌套分区在以下步骤中生成的。通常情况下,研究者选择了分区,是最有意义的一个特定的应用程序。

距离和相似的关键概念上下文聚类分析。大多数算法,特别是产生分层分区,开始distance-or-similarity矩阵。这个矩阵的细胞条目对对象之间的距离或相似之处。有许多类型的距离,其中最常见的是欧氏距离。任何两个物体之间的欧氏距离平方根的平方和的区别所有的坐标向量,定义每个对象。它可以用于变量测量区间尺度。当两个或两个以上的变量是用来计算距离,与更大的大小的变量将占主导地位。来避免,常见的做法是首先标准化变量。

距离类型的选择是至关重要的为所有层次聚类算法和取决于变量的性质和形式的集群。例如,欧几里得距离会产生球状星团。其他常用的距离包括曼哈顿距离、切比雪夫距离,权力距离和百分比分歧。曼哈顿距离被定义为变量的平均距离。在大多数情况下,它得到的结果类似于简单的欧氏距离。然而,单一的巨大差异的影响(异常值)是抑制了(因为他们不是平方)。切比雪夫距离可能适合不同的对象只有一个变量时应考虑不同。时用到的权力距离是重要的是要增加或减少的进步的重量分配到各自的变量对象是非常不同的。权力距离是由两个用户定义的参数,rp参数p控制的进步的重量放在各个变量上差异,而参数r控制的进步的重量放在更大的对象之间的差异。如果rp等于2,那么这个距离等于欧几里得距离。百分比的分歧可能时使用的数据包括分类变量。

大英百科全书yabo亚博网站首页手机的溢价订阅和获得独家内容。
现在就订阅

关联规则

当集群是由一个单独的对象,它们之间的距离可以与任何上述距离计算。然而,当集群是由两个或两个以上的对象,定义规则来计算距离。

两个之间的距离集群可以定义为两个最亲密的对象之间的距离在两个集群。被称为近邻规则,这种方法将字符串对象在一起,往往会形成链状的集群。

其他受欢迎的pair-group平均和pair-group链接规则重心。这些规则中的第一个被定义为所有成对的对象之间的平均距离在两个不同的集群。这种方法往往会形成自然不同的块对象。pair-group的重心是质心之间的距离,或重力中心的集群。

集群技术是最常用的无k算法,这是启发的原则方差分析。事实上,它可能被认为是一个反向的方差分析。如果集群的数量是固定的k,算法将会开始k随机集群,然后在它们之间移动对象的目标减少可变性在集群和最大化集群之间的可变性。

Jorge Bacallao Gallestey 百科全书的编辑yabo亚博网站首页手机