王泽峰研究组构建RNA结合蛋白的剪接调控作用预测模型

作者: 2018-11-08 来源:
放大 缩小

  基因研究示,人体内超90%的基因存在选择性剪接(alternative splicing)该过程在不同组织以及不同生理段受到格的控,其失致多种疾病的生。选择性剪接的体内控主要由前体mRNA中的式元件(cis-elements) 招募反式剪接作用因子(trans-acting  splicing  factors)来实现的。通常情况下,反式剪接作用因子存在一个模化的构成,其包括一个或多个RNA合域以及不同的功能模。但目前科学家对这些功能域的研究停留在少数几种典型的剪接因子上,如SR蛋白家族和hnRNP蛋白家族,广大的其他RNA合蛋白中的功能模却知之甚少。而深入理解些功能模科学家一步研究以至从合成新型RNA剪接因子提供依据。

  2018117日,中科院算生物学研究所、分子胞科学卓越新中心、中科院算生物学重点实验RNA生物学课题组峰研究团队在国知名学期刊Cell Systems线发表了题为Modeling and predicting the activities of trans-acting splicing factors with machine learning”的研究文。在该项工作中,研究人首次将机器学方法用于构建RNA合蛋白的剪接控作用预测模型,揭示了RNA合蛋白的序列成偏好性控作用的影响,研究RNA合蛋白的剪接活性提供了重要指,也人工合成剪接因子提供了可行性。  

  

  RNA结合蛋白剪接调控作用预测模型流程图

  在之前的研究中,该课题组发现RNA合蛋白中存在大量的序列低复区域。本研究在此基对这些序列低复区域在RNA选择性剪接中所扮演的功能行了系性研究。研究人构建人工剪接因子的方法检测了多达12种代表性序列低复区域在不同RNA位置的剪接活性,发现些低复区域在RNA选择性剪接中具有位置依性(context dependent)且相似的序列成具有相似的剪接活性。

  研究人员们进而根据些功能模的序列偏好性与其剪接活性,构建了一个以机器学方法核心的多剪接活性预测模型。利用机器学模型,他们还发现了一些此前从未的具剪接活性的序列特征。并且以此序列特征,他在世界上首次从合成有特定活性的人工剪接因子,取得了极高的成功率(10/11)研究的此项发现以后展以人工剪接因子的基因治方法除了障碍。 

  研究工作由中国科学院-普学会算生物学伙伴研究所、华东理工大学以及美国国立境健康科学研究所( NIEHS )等机构合作完成。工作在王峰研究的指下,由华东理工大学合培养博士生茅缪伟、计算生物所胡玥和杨赟副研究等完成,并得到了华东理工大学弋教授与NIEHS研究Xiaoling Li的大力支持。

  研究得到了国家基金委、上海市科委和国家留学基金委等经费的支持。(科技处) 

  文章接:https://www.cell.com/cell-systems/fulltext/S2405-4712(18)30388-0

   

   

附件: