利用基于机器学习的计算机算法,科学家们已经确定了近700个可能与肌萎缩性脊髓侧索硬化症(又称卢伽雷氏症)有关的基因。乔凡尼Cancemi
多亏了一种超级强大的基因探测方法,斯坦福大学医学院的科学家们已经发现了近700个可能与ALS有关的基因,这为药物发现和更好地了解这种衰弱的神经疾病开辟了新途径。
此前已有15个基因被证明与肌萎缩性脊髓侧索硬化症的发病有关,但只有一小部分非遗传性肌萎缩性脊髓侧索硬化症患者的一个或多个基因发生突变。科学家们怀疑有更多的基因参与其中。
“在已知与ALS有关的基因和我们怀疑与之有关的基因数量之间存在着巨大的差距,”斯坦福大学教授、遗传学主席Michael Snyder博士说。“我们的研究打开了许多与ALS有关的可能的新基因。”
全球有超过20万人患有肌萎缩性侧索硬化症(ALS),也被称为葛雷克氏症(Lou Gehrig’s disease)。它会侵蚀患者的随意肌肉运动,削弱他们走路、说话、吃饭的能力,最终影响呼吸。患者在发病后平均存活2到4年。
在大量的基因组数据中找到als相关的基因被证明是困难的——就像在绵延数英里的干草堆中找到几根针一样。但是,遗传学讲师、一篇描述这项研究的论文的主要作者之一Sai Zhang博士设计了一种方法,可以搜索大量的数据集,并找到与疾病(在本例中是ALS)相关的基因。
“我们开发了一种名为RefMap的计算机算法,它根植于机器学习,这是一种强大的数据分析方法,可以从大量复杂数据中自动识别模式。”张说。“我们想让数据引领我们。”
除了发现了许多可能导致肌萎缩性侧索硬化症的基因外,研究人员相信这项研究已经解决了关于这种疾病的几个重要问题。
斯坦福大学访问学者、英国谢菲尔德大学讲师乔纳森·库珀·克努克(Johnathan Cooper-Knock)说:“关于肌萎缩性侧索硬化症从细胞中何处起源的争论由来已久。”“这项新技术揭示了一些基因证据,这些证据确实确定了运动神经元轴突是疾病起源的地方。(神经元的轴突是一条长绳,帮助电信号从一个神经元传递到另一个神经元。)
描述这项研究的论文发表在1月18日的《神经元》杂志上。Snyder是斯坦福W. Ascherman医学博士,FACS,遗传学教授,是资深作者。Zhang和Cooper-Knock是共同的主要作者。
数以百计的新目标通常情况下,ALS研究人员一次只研究一个基因,进行深入分析,以找出该基因是否以及如何与疾病的发病有关。斯坦福大学的研究小组的方法是广泛地寻找可能对肌萎缩侧索硬化症起作用的基因。张训练该算法从被称为全基因组关联筛选的研究中筛选数百万个数据点,这些数据点包含来自数千名ALS患者和非ALS患者的匿名遗传信息。他们的策略是寻找ALS患者经常发生的基因突变。
该团队进一步缩小了搜索范围:在ALS患者的数据中,算法只寻找支持运动神经元功能的基因突变。张说:“与以前的方法相比,只在运动神经元中进行搜索,可以让我们的方法发现更多的风险基因。”分析得出了690个候选基因,其中一些已知与ALS有关。
Cooper-Knock说:“我们可以利用这些信息来更多地了解肌萎缩性侧索硬化症(ALS)中运动神经元是如何以及为什么失效的。”举个例子,他补充说,“我们发现的许多基因表明,疾病起源于细胞的轴突,而不是细胞体。”
“以前还不清楚轴突缺损是否是疾病的一种影响,但我们的结果表明,这些缺陷可能是病因,”Snyder补充说。
KANK1在数据分析中反复出现的一个基因引起了研究人员的注意:KANK1,它参与了轴突末端的功能。通过使用干细胞和基因编辑进行的一系列实验,该团队发现,这种基因的突变会导致运动神经元细胞核中一种名为TDp-43的蛋白质的丢失,这是ALS的一个标志。
Cooper-Knock说:“如果你观察100名肌萎缩性侧索硬化症患者的大脑,并分析他们的运动神经元,你会看到大约98人的TDp丧失。”“这几乎就是ALS的定义。如果没有出现这种现象,你可能就没有患上ALS。”
“这是一个令人兴奋的发现,但将KANK1作为药物靶点还为时过早。”张说。“还需要更多的研究来确定逆转KANK1基因突变的效果是否有助于治疗这种疾病。”
该团队还计划对他们数据库里的其他“发现”进行一些实验工作,以确定分析中确定的其他数百个基因中是否有任何一个可能导致肌萎缩性侧索硬化症(ALS)病理。