2023年3月3日,徐书华团队在国际知名学术期刊Molecular Biology and Evolution上以“Comparative genomic and transcriptomic analyses reveal the impacts of genetic admixture in Kazaks, Uyghurs, and Huis”为题发表最新科研成果。该研究系统性分析比较了哈萨克、维吾尔族和回族人群的基因组和转录组模式和特征,揭示了以遗传混合为驱动力的人群基因组和转录组多样性形成的机制,为深入理解人类表型的进化遗传学基础提供了机理性的视角。
现代人类族群的形成,经历了迁移、隔离、适应、分化、再接触、再融合的复杂过程。人群的迁徙与混合使得已经分化人群融合成新的基因库并进入新的生存环境,不同群体间特异性遗传变异的融合对基因组多样性和表型多样性均产生不可忽视的深远影响。因此,人群的迁徙与混合提供了天然的试验场,不同遗传成分的分化与融合为我们理解人群的遗传多样性及其表型效应提供了新的窗口。
中国西北地处欧亚大陆中心,通过河西走廊连通东西,自古便是欧亚大陆上东西方人群的融汇之地。东西方的人口交流在中国西北地区形成了大量混合人群,也导致了遗传多样性水平的抬升。团队早期的研究结果表明,中国西北地区的混合人群表现出复杂且分化的群体历史和遗传构成。以新疆维吾尔族人群为例,其先祖形成于多次东西方人群的混合,其中两次显著的群体融合事件分别发生在距今约3750和750年前。维吾尔族人群的遗传成分主要起源于欧亚大陆上东、南、西、北四个方位的已分化的人群,大致可以由现代东亚人(28.8%–46.5%),南亚人(12.0%–19.9%),西欧人(24.9%–36.6%)和西伯利亚人(15.2%–16.8%)来代表。此后,团队又开展了基于新疆维吾尔族人群全基因组测序数据的分析工作,系统性地研究了“人群混合的效应”这一基础性问题,揭示了以遗传混合为驱动的人群基因组遗传多样性的形成及其表型效应。该研究通过结合基因组与转录组数据对中国西北几个典型混合人群开展跨人群的比较分析,力图进一步解析人群混合在基因组和转录组遗传多样性层面的影响,以及探讨遗传混合的表型效应。
该项研究首先基于哈萨克、维吾尔族和回族人群的基因组数据全面地构建了各个人群的遗传结构与群体历史。三个人群均具有复杂的混合模式。为便于建模分析,将混合模式简化为二元混合模型,哈萨克、维吾尔族和回族的遗传结构分别可以解析为56.1%–65.3%、42.2%–58.0%、83.6%–98.0%的东方祖源成分,其他祖源成分则来自于西方祖先人群。哈萨克人群经历的两次最显著的群体融合事件分别发生在距今约3000年和750年前,维吾尔族人群的混合时间则相对较早(分别为距今约3750年和750年前),而回族人群的时间则较为近期(分别为距今约900年和400年前)(图1)。
图1. 维吾尔族(XJU)、哈萨克(KZK)和回族(HUI)人群的混合模式。
基于全基因组等位基因频谱的分析表明,上述三个混合人群的全基因遗传构成符合理论预期(图2),代表性的例证包括EDAR基因等,该基因与东亚人群的头面部以及毛发特征相关,其等位基因频率与相应人群的混合比例密切相关,可能进一步影响了人群的表型多样性。此外,三个混合人群基因组上均能检测到一些与免疫和代谢等功能相关的适应性演化迹象,意味着人群特异性的环境适应性演化对人群基因组局部遗传多样性的塑造作用。
图2. 维吾尔族(XJU)、哈萨克(KZK)和回族(HUI)人群混合后的全基因组等位基因频谱。
通过构建基因组等位基因频率与基因表达水平之间的关联,结果表明混合塑造的基因组遗传多样性能够进一步影响混合人群的转录组多样性(图3)。当祖先人群具有相近的遗传贡献时(如50%的东亚祖源贡献和50%的西欧祖源贡献),混合人群基因表达的调控效应会达到更高水平,也对应了更多的调控元件数量。研究还发现,祖先人群间的基因表达差异能够在一定程度上遗传至混合人群,表明祖源成分反映了基因表达调控的遗传基础,且基因表达模式可通过遗传混合被继承。该研究鉴定了人群特异性的调控元件,其中相当一部分涉及免疫与代谢等相关功能。通过分析人群间的差异表达基因,研究发现部分差异表达基因表现出人群特异性的表达调控模式,且多与生命健康和疾病表型相关,如系统性红斑狼疮、酒精性胰腺炎等,可能与不同时期人群特异性的环境适应性演化以及人群经历了环境或生活习惯变迁相关。
图3. 遗传混合对转录组调控元件的效应。
该工作系统性分析了我国西北混合人群的基因组和转录组多样性,探索遗传混合对混合人群基因组和转录组遗传多样性的影响,以及相应的表型效应。研究结果表明,群体遗传交融可能是塑造人群基因组和转录组多样性的一种重要驱动因素。
中国科学院上海营养与健康研究所潘雨闻博士、宁之琳博士、复旦大学人类表型组研究院博士研究生温佳为本文共同第一作者。该项工作与新疆大学多力坤·买买提·玉素甫教授、新疆医科大学关亚群教授等合作完成。复旦大学生命科学学院徐书华教授与陆艳副研究员为通讯作者。复旦大学生命科学学院、人类表型组研究院、附属中山医院为通讯单位。参与该研究的共同作者还包括复旦大学杨亚军研究员,以及中国科学院上海营养与健康研究所袁媛副研究员、博士研究生刘栩冰。该项工作获得了国家自然科学基金基础科学中心项目、重点项目、英国皇家学会-牛顿高级研究员基金、上海市市级科技重大专项等基金资助。