一个专门讲聚类的网页课程 - Alexander Strehl 2002-05-03html
值得借鉴的一个工具:SC3: consensus clustering of single-cell RNA-seq data node
1. 如何在一个模型里整合多种距离度量;算法
2. 方法的数学化;工具
可行性分析htm
假设接口
连续性 - 与clustering的假设正好相反事件
分支事件get
特征的选择;距离的度量;数学
限定KNN的必要性;引用
MST构建;
主支的构建和简化;省略中间点;最短路径;
迭代处理全部分支;统计
投射全部细胞;使用longest branch
root the tree;
相对主线的深度的拓展
简化的ggtree;nodes center
下游分析
分支的显著性排列,节点数、深度;
branching driving factor
聚类比较
pseudotime比较
技术细节:
特征选择
drop out处理
outlier处理
拓展:
大规模测序应用,减小算法复杂度;
留好各类接口,便于个性化分析;
方便使用,提升引用率;
敏感性和特异性的平衡;