predicting protein-protein interactions

图:塔夫斯大学计算机科学系和麻省理工学院(MIT)合作设计了一种结构驱动的深度学习方法,该方法基于神经语言建模的最新进展。该团队的深度学习模型被称为D-SCRIpT,能够从主要氨基酸序列预测蛋白质-蛋白质相互作用(ppIs)。

资料来源:麻省理工学院研究员罗希特·辛格提供。

在《细胞系统》杂志上发表的一项研究中,塔夫茨大学计算机科学系的Lenore Cowen教授和麻省理工学院(MIT)的同事合作设计了一种结构驱动的深度学习方法,该方法基于神经语言建模的最新进展。该团队的深度学习模型被称为D-SCRIpT,能够从主要氨基酸序列预测蛋白质-蛋白质相互作用(ppIs)。

这些预测使研究人员能够用聚类方法建模ppI网络,并能够检测功能子网或模块。科学家研究生物的ppI网络是了解其信号通路的一种手段,可以更好地预测细胞行为和基因功能,而发现ppI网络中的功能模块可以帮助研究人员更深入地了解细胞功能组织。

Cowen和研究人员Sam Sledzieski、Rohit Singh以及麻省理工学院计算机科学和人工智能实验室的著名计算生物学家Bonnie Berger发现,D-SCRIpT模型在训练了超过38000个人类ppIs后,与目前最先进的方法(深度学习方法pIpR)相比,能够更好地进行泛化,因此可以表征苍蝇蛋白。他们还应用D-SCRIpT筛选了与奶牛消化相关的ppIs,并鉴定了与免疫反应和代谢相关的功能基因模块。

研究人员得出结论,根据人类ppI数据训练的D-SCRIpT模型可以应用于许多感兴趣的物种——关键是,即使是那些很少研究或缺乏ppI数据的物种。

文章标题

D-SCRIpT translates genome to phenome with sequence-based, structure-aware, genome-scale predictions of protein-protein interactions