聚类分析是一种广泛使用的统计方法,它根据选定的统计距离函数将观察到的数据集划分为几个子类或簇。聚类算法可分为两类:层次聚类方法和非层次聚类方法。这两种算法都将观察到的数据集划分为子组,从而将具有相似代谢组学特征的数据集放在每个子组中。
层次聚类(HCL)通过使用以下程序生成树状图来对齐数据集:
非层次聚类(non-HCL)也将数据划分为子类,但没有任何层次组织。K-均值法和模糊c-均值法是非hcl的典型例子。在k -means方法中,首先随机选择k个数据点来接近每个簇的平均值,然后为每个簇计算一个新的平均值,并将模式重新分配给新的平均值。这个集群过程会不断重复,直到集群意味着没有模式从一个集群移动到另一个集群。K-means方法只将每个数据点分配到一个簇中,而模糊c-means方法允许将一个数据点分配到几个簇中。模糊c-均值也计算属于每个聚类的一个数据点的概率。当样本的集群数量未知时,这些分析被广泛应用,并且可以应用于一次性快照分析和时间过程数据。
Creative Proteomics提供的聚类分析服务,包括:
如何下订单:
*如果贵公司需要签署保密协议,请通过电子邮件与我们联系