
Plant RNA-FM是一种人工智能模型,它借助来自1100多种植物的RNA数据展开训练,致力于解码遗传模式。这一举措旨在推动植物科学的发展,优化作物品质,并积极应对全球农业领域所面临的挑战。
一项研究合作成果——一种具有开创性的人工智能(AI)模型应运而生,其目标是对构成植物遗传“语言”的序列以及结构模式进行深度解码。
这种被命名为“Plant RNA-FM”的创新模型在同类研究中尚属首例,它是约翰英纳斯中心的植物研究人员与埃克塞特大学的计算机科学家携手合作开发而成的。
该模型的创造者们表示,这是一项意义非凡的技术突破,有望为植物科学的发现与创新注入强大动力,并且有可能在无脊椎动物和细菌的相关研究中发挥积极作用。
RNA与DNA类似,作为贯穿所有生物体的重要分子,以其独特的序列和结构承载着遗传信息。在基因组中,RNA的结构是由核苷酸构建块组合而成,而核苷酸的排列方式恰似语言中单词和短语的字母组合方式。
解码RNA的复杂结构
在约翰英纳斯中心,丁义良(音译)教授所带领的团队专注于RNA结构的研究,RNA结构是RNA分子的关键语言之一。RNA能够折叠成复杂的结构,进而调节诸如植物生长和应激反应等复杂的生物功能。
为了更深入地理解RNA的复杂语言及其功能,丁教授的团队与埃克塞特大学李科(音译)博士的团队展开了合作。
他们共同研发出了PlantRNA-FM,这是一个在由540亿个RNA信息构成的庞大数据集上完成训练的模型,这些信息构成了1124种植物的遗传字母表。
在创建PlantRNA-FM的过程中,研究人员借鉴了ChatGPT等人工智能模型训练理解人类语言的方法。人工智能模型通过研究世界各地植物物种的RNA信息,学习基于植物的语言,从而实现对RNA在植物界作用机制的全面了解。
就如同ChatGPT能够理解和回应人类语言一样,PlantRNA-FM也已经掌握了RNA序列和结构语法与逻辑的理解能力。
研究人员利用该模型对RNA功能进行了精准预测,并在转录组中确定了特定的功能性RNA结构模式。他们的预测已经得到了实验验证,PlantRNA-FM所鉴定的RNA结构会对遗传信息转化为蛋白质的效率产生影响。
约翰英纳斯中心丁一亮(音译)教授小组的博士后研究员余浩鹏(音译)博士说道:“尽管RNA序列在人眼看来可能显得毫无规律,但我们的人工智能模型已然学会了破解其中潜藏的模式。”
具有未来潜力的合作努力
此次成功的合作还得到了东北师范大学和中国科学院科学家们的支持,他们也为这项工作贡献了自己的力量。
丁教授表示:“我们的PlantRNA-FM仅仅是一个开端。我们正在与李博士的团队紧密协作,致力于开发更为先进的人工智能方法,以探寻自然界中隐藏的DNA和RNA语言。这一突破为理解和编程植物带来了全新的可能性,这或许会对作物改良以及下一代基于人工智能的基因设计产生深远的影响。人工智能在助力植物科学家应对各种挑战方面正发挥着日益重要的作用,从保障全球人口的粮食供应到培育能够在不断变化的气候中茁壮成长的作物,都离不开它的支持。”
机构