基于一致聚类和最小生成树集合的基因表达数据的细胞谱系稳健推断。

ECLAIR的Python项目详细描述


如何生成eclair图和树

eclair代表用于血统分析、推断的集成聚类 以及稳健性。它按如下方式进行:

  • 在亲和力传播、分层或k-means聚类中进行选择 和dbscan(cf.我们的 dbscan_multiplex concurrent_ap dbscan和 亲和力传播聚类)用于如何从 数据集的子样本。
  • 通过基于密度的下采样(如 在python上发布的密度采样软件中实现 包索引),或者通过针对数据点的总数 从数据集中提取或通过指定 根据每个数据点周围的本地密度建立的分布。
  • 然后eclair开始进行几轮下采样 在这样的子样本上进行聚类,迭代次数由指定 用户。在每次对给定子样本进行聚类之后, 下采样过程留下的数据点是 通过将它们与 高维特征空间。
  • 对于每次这样的运行,构建一个最小生成树。这个最小值 生成树是由l2对相似矩阵得到的。 在与每个簇相关联的质心之间。
  • 下一步从这个集合中获得一致的聚类 整个数据集的分区。三种启发式方法是 为此考虑:CSPA、HGPA和MCLA,所有这些都基于 关于图或超图划分(参见 集群集成 包以获取更多信息。
  • 一旦达成一致的聚类,我们就从 共识集群和来自与 这些一致性集群所具有的分区的集合 已计算。此图的边权重计算为 以下分布的平均值:对于每个由 来自一致性集群的一个数据点和另一个数据点 从consense cluster b ,扫描分区集合 记录下两个样本之间的距离 组成群集集成的每个分区。
  • 然后我们从这个图中得到一个最小生成树 可视化的便利性以及与 很少有其他方法能提供细胞谱系的估计 (包括流行的黑桃法,其重现性问题刺激了 eclair的发展。本包中的一个模块确实专门用于 说明ECLAir优越的统计性能)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Gson类中的java验证错误   If和elseif之间的java差异?   字典Java8地图。输入比较器   java连接到远程计算机以获得WMI支持   java如何使用改型处理JSON对象中的空值   在Java中使用Comparator时不可编译的源代码   java将Jar添加到JSP的运行时路径   带有随机对象的while循环的java大O时间复杂性   java可以在不考虑参数的情况下模拟方法吗?   java我有一个简单的代码,它不工作。无法修复错误“println”   向eclipse添加Xively java库   java是否可以启用本机代码的缓存?   全局变量如何在Java中的所有类之间共享要使用的语言环境?   Java内存游戏如何翻转单个卡?