作物智能设计育种
基本介绍
作物智能设计育种是基于作物重要农艺性状形成的遗传和分子基础,通过人工智能决策系统设计最佳育种方案,进而定向、高效改良和培育作物新品种的一门新兴前沿交叉学科。
根据理论基础和技术手段的不同,未来智能设计育种可以分为两种范式:
- 一是智能化的杂交育种,根据作物目标性状的遗传结构,采用分子标记辅助选择或全基因组选择策略,将优良等位基因聚合到优良遗传背景中,创造出集众多优良基因和调控模块于一身、目标性状得到明显改良的新种质或新品种;
- 二是智能化的生物育种,其利用人工智能技术设计优异等位变异和基因组元件,利用转基因和基因编辑技术写入基因组,精准改良目标性状。
未来作物智能设计育种特征:
- 智能化的杂交育种以育种大数据和育种模型为基础,精准设计自然变异的最优组合,并以最快捷的杂交组配方式实现自然变异的最优组合;
- 智能化的生物育种利用人工智能技术和合成进化技术,设计 DNA/蛋白质序列,可以“道法自然、超越自然”,指导作物的基因编辑育种和合成生物学。
智能化的杂交育种:自然变异的智能组合
杂交育种的本质就是在田间环境条件下,通过育种材料的杂交和后代群体的人工选择,寻求有利等位变异的最优组合方式。
QTL 对未来育种的价值可能会逐渐降低。Wallace等指出,能够用关联分析和连锁分析检
测到的 QTL都是效应较大的,这样的 QTL往往被早期的育种家在骨干种质中优化并固定,后期的育种家只能耗费更多的资源去优化更加微效的QTL。
在水稻、小麦、玉米等作物已经克隆到的海量 QTL中,只有少数 QTL能够在当代主栽品种的遗传背景下改良农艺性状。说明了在大效应位点固化之后聚合微效有利等位变异的艰难。
QTL往往具有多效性,育种家需要在多个相互拮抗的育种目标(如生物量和抗倒伏性,产量和抗逆性,产量和品质)中寻求稳健的平衡;还需要根据特定的水、肥、光照条件选择最优的自然变异组合。因此,育种材料中一些看似尚未被优化的基因组位点,如果放在更广阔的环境因素中考虑,可能代表着全局最优解。
群体中的大部分有害变异是隐性的,自交可以暴露隐性有害变异的表型效应,有助于
通过自然选择和人工选择降低有害变异在群体中的频率。营养繁殖的作物(如土豆、木薯)有害变异十分严重,异交作物(如玉米)会比自交作物(如水稻)在基因组中保留更多的有害变异,且有害变异倾向于富集在重组频率较低的基因组区段(如着丝粒附近)。
编码区的有害变异可以通过变异位点的保守性以及变异在群体中的频率来间接判断,常用工具有GERP、SIFT等;转录调控区的有害变异往往使基因的表达量偏离群体的平均水平,进而降低个体的适合度。在生产上可以利用携带互补有害等位变异的 2个自交系产生杂交种,让 2套基因组互相掩盖对方的有害等位变异(即杂种优势)。
在玉米育种中,目前国际种业公司普遍采用全基因组选择技术,更加精准地聚合微效有利等位变异、清除微效有害等位变异。全基因组选择在基础理论上已经不存在尚未解决的科学问题,将该技术用于育种的难点在于如何以工程化育种的思路,以合适的体制机制将人力、物力、财力资源有机整合,效仿日本丰田公司“拧干毛巾上最后一滴水”的精神,实现育种流水线的高效、低成本运转。
实现智能杂交育种需要从数据、模型、育种辅助技术3个方向寻求突破:
- 育种大数据的积累(基因型、表型、环境);
- 统计模型。但是目前模型构建所需的数学和计算机理论基础已经非常成熟,单纯依靠算法优化提升育种决策精度的空间已经很小;
- 辅助技术。如快速育种、单倍体育种、染色体定点重组、无融合生殖、智能不育技术等。
智能化的生物育种:人工变异的智能创制
根据中性进化理论,自然界发生的大部分有利突变都会在遗传漂变的过程中丢失。长远来看,自然界尚未被育种家发掘和利用的优异等位变异数量不断减少,日渐枯竭。
建立从基因组序列预测分子表型的深度学习模型,然后利用深度学习模型扫描自然变异,预测哪些自然变异可能造成分子表型的改变,这些变异可能是最终表型的功能变异。可以指导基因编辑育种,对杂交育种形成重要的补充。
过去几十年中,在作物中已鉴定到大量位于转录调控区的优异等位变异,表明转录
调控区的优化在作物驯化和改良中占有重要地位。
利用人工智能技术精准设计自然界不存在的优异等位变异,并利用基因编辑技术将优异等位变异写入作物基因组,改良关键农艺性状,对传统杂交育种形成补充。
深度学习领域的新分支——生成模型(generativemodel)技术可以从大量已知的生物学序列中总结规律,进而从头设计具有优异生化特性的、全新的生物学序列。例如,通过学习自然界的启动子 DNA序列,生成模型可以设计自然界不存在的启动子;通过学习自然界的蛋白质,生成模型可以设计自然界不存在的蛋白质。
作者:汪海、赖锦盛、王海洋、李新海
中国农业科技导报,2022