根据发表在《自然通讯》上的一项新研究,机器学习可以确定“重要基因”,帮助作物以更少的肥料生长。它还可以预测植物的其他特征和动物的疾病结果,说明其在农业之外的应用。
使用基因组数据来预测农业和医学的结果对系统生物学来说既是承诺也是挑战。研究人员一直在努力确定如何最好地利用大量可用的基因组数据来预测生物体如何对营养、毒素和病原体暴露的变化做出反应——这反过来又会为作物改良、疾病预后、流行病学和公共卫生提供信息。然而,从基因组规模的信息准确预测农业和医学中如此复杂的结果仍然是一个重大挑战。
在NatureCommunications研究中,纽约大学和的研究人员和合作者使用机器学习解决了这一挑战,机器学习是一种用于检测数据模式的人工智能。
GloriaCoruzzi、Carroll&Milton解释说:“我们表明,关注表达模式在物种间进化保守的基因,可以增强我们学习和预测对主要作物生长性能以及动物疾病结果的‘重要基因’的能力。”纽约大学生物学系和基因组学与系统生物学中心的皮特里教授,该论文的资深作者。
“我们的方法利用了物种内或物种间全基因组表达和相关表型的自然变异,”该研究的主要作者、纽约大学基因组学与系统生物学中心和国立大学的Chia-YiCheng补充说。“我们表明,将我们的基因组输入减少到表达模式在物种内和物种间保守的基因是降低基因组数据维数的生物学原理方法,这显着提高了我们的机器学习模型识别哪些基因对基因很重要的能力。一个特质。”
作为概念验证,研究人员证明了对氮的反应在两种不同植物物种之间进化保守的基因-拟南芥,一种广泛用作植物生物学模式生物的小型开花植物,以及最大的作物玉米品种-显着提高了机器学习模型预测植物如何有效利用氮的重要基因的能力。氮是植物的重要养分,是肥料的主要成分;更有效地利用氮的作物长得更好,需要的肥料更少,具有经济和环境效益。
研究人员进行的实验验证了八种主转录因子作为对氮利用效率具有重要意义的基因。他们表明,拟南芥或玉米中基因表达的改变可以促进低氮土壤中植物的生长,他们在纽约大学的实验室和伊利诺伊大学的玉米田中进行了测试。
“现在我们可以更准确地预测哪种玉米杂交种更擅长在田间施氮肥,我们可以迅速改善这一性状。提高玉米和其他作物的氮肥利用率可以通过降低农民成本、减少环境污染、并减少农业中的温室气体排放,”研究作者、伊利诺伊大学厄巴纳-香槟分校作物科学亚历山大教授斯蒂芬穆斯说。
此外,研究人员证明,通过预测植物中的其他性状,包括拟南芥和玉米的生物量和产量,这种基于进化的机器学习方法可以应用于其他性状和物种。他们还表明,这种方法可以通过研究小鼠模型来预测对另一种主要作物水稻的抗旱性以及动物疾病结果具有重要意义的基因。
“因为我们表明我们的进化信息管道也可以应用于动物,这突显了它有可能发现对生物学、农业或医学感兴趣的任何生理或临床特征具有重要意义的基因,”Coruzzi说。
“许多具有农艺学或临床重要性的关键性状在遗传上很复杂,因此很难确定它们的控制和遗传。我们的成功证明大数据和系统级思维可以使这些众所周知的困难挑战变得容易处理,”该研究的作者、教师YingLi说。在普渡大学园艺和景观建筑系。