Sankey

超大宏基因组数据集CuratedMetagenomicData

简介

CuratedMetagenomicData(https://waldronlab.github.io/curatedMetagenomicData/)的目标是用标准化的流程(MetaPhlan2、HUMAnN2)分析已发表的宏基因组数据并建立一个统一的数据集合。目前已经收录6000余个样本并在持续扩建当中。样本涵盖糖尿病、肥胖症、IBD等多种疾病,涉及皮肤、口腔、粪便等多处样本。

桑基图(Sankey diagram)

桑基图(Sankey diagram)是用于表示能量或信息流动的一种可视化方式,应用于微生物组数据,可以清晰展示各个taxonomy level之间物种相对丰度的流动。从Domain到Species,相邻两级之间分支的总宽度保持不变(能量守恒),如下图