6月5日,国际学术期刊Nature Communications在线发表了中国科学院上海营养与健康研究所Andrew E. Teschendorff研究组题为“Cell-attribute aware community detection improves differential abundance testing from single-cell RNA-Seq data”的最新研究成果,提出了一种基于网络的新型算法,用于检测衰老或疾病组织中细胞丰度的变化。
衰老和疾病的发生,往往伴随着复杂组织中各种细胞类型丰度的变化,精确检测这些变化极具挑战性。单细胞组学数据为检测这些变化提供了宝贵的资源,但仍需开发严谨的统计方法。
Andrew E. Teschendorff研究员和博士后Alok Maity共同开发了一种名为ELVAR的新型算法,该算法显著提高了从单细胞或单细胞核RNA测序数据中检测细胞丰度变化的灵敏度。其关键的概念突破是利用细胞聚类算法识别更相关的细胞状态,并在该过程中考虑了细胞属性,例如细胞所属个体的年龄或疾病阶段。节点属性感知聚类在网络学领域有着广泛的应用,在不同类型的复杂数据集上表现出良好的性能。Teschendorff和Maity的工作表明,类似的算法也可以应用于单细胞组学数据中。应用ELVAR,他们发现在结直肠腺瘤的癌前组织中,肠干细胞和调节性T细胞的比例增加,表明这些细胞类型丰度的变化可能是结直肠癌风险的一个重要指标。另外,他们发现长期嗅觉丧失的Covid-19患者的嗅觉上皮中嗅觉感觉神经元明显减少,以及肺组织内发生与年龄有关的巨噬细胞极化。
从生物学和临床角度来看,这项研究的意义在于ELVAR能够从稀疏的单细胞核RNA测序数据中检测出结肠组织中细胞丰度的变化,为实现基于单细胞技术的癌症早期检测和风险预测提供了可能。
中国科学院上海营养与健康研究所博士后Alok Maity为该论文的第一作者。Andrew E. Teschendorff研究员为该论文的通讯作者。研究项目得到了国家自然科学基金委和中国科学院的资助。
图例:ELVAR算法可利用不同阶段结直肠腺癌的单细胞核RNA-Seq数据检测关键细胞类型的丰度。如图所示,肠干细胞丰度在息肉中相对于正常组织有所增加。