2月8日,华中农业大学生物信息团队杨庆勇教授课题组在国际学术期刊Molecular Plant在线发表题为“BnVIR: bridging the genotype-phenotype gap to accelerate mining of candidate variations for traits in Brassica napus”的研究论文,该研究建立了甘蓝型油菜基因型与基因表达、表型的关联,为快速、高效地挖掘油菜候选变异/基因提供了平台。
该研究首先构建了一套由2,311个甘蓝型油菜核心种质鉴定的10,090,561个遗传变异的数据集,其中包括SNP、InDel和不同种类的SV,这是目前已发表的最为系统、最为完整的甘蓝型油菜遗传变异集合。该研究以其中1,703个材料的18个性状的表型数据和309个材料的RNA-seq数据为基础,构建出甘蓝型油菜变异信息资源数据库BnVIR(http://yanglab.hzau.edu.cn/BnVIR)(图1)。
图1 BnVIR数据库主页、构建流程和概貌
该数据库提供了群体水平的遗传变异基因型与表型和基因表达量的关联,可辅助快速挖掘与油菜性状相关的候选变异和基因(图2)。此外,该数据库为甘蓝型油菜种质资源的查询、群体遗传学和进化分析以及关联分析等提供了多种工具。最后,该研究通过挖掘一些已报道的(如FLC.A10、FAE1.A08、FAE1.C03、FAD2.A05)和新鉴定的候选基因和功能变异的案例分析,以及独立表型数据集的检验分析等系列工作,系统全面地展示了该数据平台在挖掘与表型相关的候选变异和基因的潜力、可靠性与稳健性(图3)。与现有甘蓝型油菜数据库不同,BnVIR提供了更加全面、更加丰富的变异及其与多个组学数据的关联和更加友好和丰富的用户界面,可显著提高研究者挖掘候选变异和基因的效率,并为甘蓝型油菜的分子育种开发提供有价值的标记。
图2 使用BnVIR数据库验证/挖掘候选基因/变异的实例
遗传变异是物种表型多样性形成的物质基础,包括单核苷酸多态性(SNP),小片段的插入/缺失(InDel)以及大规模结构变异(SV)。目前,遗传变异已被广泛应用于人类疾病、动植物重要农艺或经济性状相关遗传位点的鉴定、重要功能基因的克隆、分子标记辅助选择育种等工作。对于作物遗传育种,准确了解遗传变异对基因的调控效应以及与表型分化的关联,对种质资源的精准鉴定和优异等位基因的挖掘具有重要作用。
油菜作为世界四大油料作物之一,在全球范围内为人类的生活和生产提供优质的食用植物油和饲料蛋白来源。我国年均油菜生产和消费居世界首位,常年种植面积1亿亩左右,占油料作物面积的50%以上,油菜安全生产在保障我国食用油供应和蛋白饲料需求上发挥着重要作用。近年来,经过一代又一代油菜科学家的努力,我国油菜研究实现了从理论、技术、产品到转化的链式创新,推动了我国油菜基础研究与应用步入世界第一方阵(《中国农业农村科技发展报告(2012—2017)》)。然而,当前我国油菜大多仍以常规育种与分子标记辅助选择育种技术为主,与国外大规模应用的以基因组选择为核心的分子育种技术相比,在品种育成速度、成功率及效率等方面仍有较大差距。因此,如何将基础研究中长期积累的资源和多组学数据(基因组、转录组等)优势转化成育种优势,是当前油菜遗传育种的核心研究内容之一。
随着后基因组代的到来,作物科学领域已积累海量数据,利用生物信息技术将大规模的多组学数据进行系统的整合和分析,并构建更友好的图形化、可视化数据库,将极大促进重要农艺性状的功能基因的发掘及机制解析,推动优异种质资源的开发和利用,加快品种选育。这对发展高效、精准的新一代生物育种,打赢种业翻身仗具有重要意义。该研究不仅为甘蓝型油菜今后的遗传育种提供了重要平台,也为其他作物进行整合和利用多组学数据推动育种产业发展提供重要参考。
我校信息学院杨庆勇教授为论文通讯作者,信息学院已毕业博士生杨植全(现广州大学博士后)、博士研究生梁聪园和硕士研究生魏璐露为论文共同第一作者。我校作物遗传改良国家重点实验室周永明教授、郭亮教授对本研究提供了重要指导。该研究得到国家自然科学基金、国家重点研究发展计划和中央高校基本科研业务费专项资金项目资助。
杨庆勇教授课题组近年来聚焦“油菜基因组学与分子育种”研究方向,先后与国内多个研究团队合作,通过系统整合和分析甘蓝型油菜的多组学数据,构建了首个油菜泛基因组(Nature Plants, 2020)及其数据库BnPIR(Plant Biotechnology Journal, 2021)、油菜转录组数据库BnTIR (Plant Biotechnology Journal, 2021)、油菜遗传变异数据库BnVIR(Molecular Plant, 2022)和植物遗传变异参考面板数据库Plant-ImputeDB (Nucleic Acids Research, 2021),搭建了我国自主可控的油菜参考基因组生态。目前在Molecular Plant、Nature Plants、Nucleic Acids Research、Plant Biotechnology Journal等杂志发表多篇油菜基因组和数据库论文。
【英文摘要】
Genetic variations, which range from single nucleotide polymorphisms (SNPs) and short insertion/deletions (InDels) to large-scale structural variations (SVs), are the basis of phenotypic diversity. Understanding the effect of genetic variations on traits is critical for uncovering the genetic architecture of various phenotypes. In humans, great efforts have been made to catalog the huge amounts of variations in single locus and their functional and phenotypic impacts, as well as detect the genetic interactions between loci underlying complex diseases, which are of great significance for pathologic studies (Civelek and Lusis 2014; Karczewski et al., 2020; Li et al., 2013)。 In plants, the functional and phenotypic impacts of genetic variations remain largely unknown. As an important oil crop, Brassica napus (B. napus) provides high-quality vegetable oil and feed protein worldwide (Chalhoub et al., 2014)。 Substantial genotypic, transcriptomic and phenotypic data of B. napus have become available in public databases recently (Liu et al., 2021; Song et al., 2020; Yan et al., 2021), which provide important resources for molecular marker-assisted breeding and genetic improvement of B. napus. However, the mining of candidate variations/genes has been largely hindered by the lack of solid association between genotype and phenotype and the corresponding platform (Yan et al., 2021)。 Here, to bridge the gap between genotype and phenotype, we first constructed a large panel of genetic variations, and presented the most systematic and complete variations of B. napus, including SNPs, InDels and various SVs. Then, phenotype data from traits of 1,703 accessions and RNA-seq data of 309 accessions were used as a basis to assemble a B. napus variation information resource (BnVIR; http://yanglab.hzau.edu.cn/BnVIR)。 The database provides genotype-phenotype maps for rapid mining of candidate variations/genes associated with various traits in B. napus. Besides, it is the first platform for checking the genetic interactions between candidate loci or genes associated with quantitative traits.
论文链接:https://www.cell.com/molecular-plant/fulltext/S1674205222000508