日前,美国西奈山伊坎医学院的研究者通过使用新的机器学习技术,基于超过10万名个体的信息研发了预测模型,并发现了413个与精神分裂症发病相关的基因关联,横跨13个脑区。
研究指出,通过在组织层面分析基因表达情况,研究者不仅能够找到与精神分裂症发病相关的新基因,还可以确定异常表达可能发生在哪些脑区。本项同领域内规模最大的研究于2019年3月25日发表于Nature Genetics(影响因子 27.125)。
虽然患病率不到2%,但精神分裂症长期以来一直是全球范围内重要的致残原因之一,对公共卫生及社会经济造成沉重影响,主要来自反复入院及高昂的治疗费用。目前普遍认为,大量基因与精神分裂症患病风险的升高相关,但该病确切的遗传学基础仍不清楚。然而,这一状况也激发了很多研究者的斗志:对于任何疾病而言,发现与疾病有关的基因对于理解疾病机制均至关重要。
在这一背景下,西奈山的研究者使用了全基因组关联分析(GWAS)的发现,配合转录组填充(transcriptomic imputation)技术,对精神分裂症的遗传学基础展开了探讨。其中,GWAS在生物医学研究中的应用逐渐增加,即在人类全基因组范围内分析序列变异,判断某种序列变异是否在特定疾病(如精神分裂症)患者中更常见。转录组填充是一种新的机器学习技术,使得研究者可针对难以直接触及的组织(如脑组织)探讨疾病与基因表达的相关性。
分析40,299名精神分裂症患者及62,264名匹配对照的数据后,研究者发现,精神分裂症风险基因的表达贯穿整个发育阶段——其中一些在妊娠期的特定阶段表达,而另一些则在青少年期或成年期表达。研究者还发现,不同脑区「携带」精神分裂症的风险也存在差异,基因关联最强的脑区为背外侧前额叶皮质(DLPFC)。
研究者Laura Huckins博士指出,新的预测模型给予了研究者「空前」的力量,以探讨精神分裂症预测基因的表达及找到新的高危基因。一个尤其吸引人的发现在于,精神分裂症风险基因在整个发育过程中均有所表达,包括妊娠早期。
「通过奠定转录组填充与GWAS发现相结合的基础工作,我们不仅希望能更好地阐明基因本身,也希望能打造此类研究方法及设计的未来。」