基于4种作物的ρWGD分析发掘籽粒发育关键基因

全基因组复制(whole genome duplication,WGD)广泛存在于植物界,对植物新器官或新性状形成、次生代谢产物合成和积累、以及提高植物环境适应性等具有重要意义。禾本科植物共同祖先约在9800万年前经历了一次WGD(称为ρWGD),随后分化形成现有的禾本科植物。禾本科多数植物,尤其作物籽粒具有大胚乳,贮藏了丰富的淀粉和蛋白质等营养物质,其发育状态决定了作物的产量与品质。ρWGD是否演化出籽粒特异表达基因或影响籽粒发育的关键基因,其对籽粒发育有何遗传贡献等尚不清楚。因此,本研究以水稻、谷子、高粱和玉米4种作物为研究对象,结合基因组和转录组数据,通过比较基因组分析,鉴定ρWGD基因,重点分析在籽粒中表达和特异表达的ρWGD基因的序列和表达分化特征,并构建籽粒基因调控网络,探究ρWGD对调控网络的遗传贡献,挖掘ρWGD-hub-TFs等潜在的影响籽粒发育的关键基因,为作物产量和品质改良提供基因资源。主要研究结果如下:1、四种作物ρWGD基因倾向于在籽粒中表达。通过基因组内同源比对、共线性分析以及Ks分析,鉴定了4种作物的ρWGD保留基因对,水稻2732对,高粱2472对,谷子2417对,玉米2382对(m WGD保留5000对)。结合转录组数据发现4种作物ρWGD基因对75%以上都在籽粒中表达,并且部分演化成为籽粒特异表达基因(10.92%-21.68%)。对籽粒表达的ρWGD基因进行功能富集分析,发现这些基因主要涉及转录因子,信号转导以及环境适应等功能,而玉米m WGD保留的基因显著富集到蛋白质的合成和加工等途径。2、籽粒表达/特异表达ρWGD基因对间存在序列差异,且发生表达分化的ρWGD基因D-Lin-MC3-DMA试剂对间的序列差异更大。采用WGCNA聚类分析,对在籽粒中表达和特异表达的ρWGD基因对进行表达分化分析,发现在籽粒中表达的ρWGD基因对绝大多数都发生了表达分化(76%-80%),在籽粒中特异表达的基因对分化程度更高(79%-87%)。玉米m WGD基因对也发生了表达分化,其籽粒表达和特异表达基因对的分化比例分别是64%和73%,表达分化程度略低于ρWGD基因对。序列特征分析发现,表达分化基因对的蛋白质序列一致性更低,GC含量差异更大,表达分化和表达相似基因对都受到纯Orthopedic infection化选择(Ka/Ks<1);4种作物ρWGD基因对的启动子区均表现出受负选择(Kn/Ks<1),而玉米m WGD基因对启动子区表现出受正选择(Kn/Ks>1),其启动子区域发生了较大的序列改变。3、ρWGD产生了大量hub-TFs,且部分ρWGD-hub-TFs在多个物种中保留,对籽NSC 127716生产商粒发育调控网络有重要影响。使用GENIE3软件包构建籽粒表达基因的调控网络,在水稻、谷子、高粱和玉米中分别筛选得到68个、95个、114个和121个hub-TFs,其中有22个、28个、33个、31个为ρWGD-hub-TFs,46个为m WGD-hub-TFs,可见ρWGD产生了高比例的hub-TFs。通过共线性分析发现有2组ρWGD-hub-TFs在4种作物中保留,表明ρWGD对4种作物籽粒调控网络的贡献具有一定的共性。进一步分析网络中hub-TFs调控的核心网络,发现在核心网络中还存在其它由ρWGD产生的转录因子和基因,表明ρWGD促进了籽粒调控网络的重塑和复杂化。4、ρWGD使水稻淀粉生物合成代谢途径中的关键酶基因以及调控这些酶的转录因子都发生了扩张,表明ρWGD促进了籽粒贮藏淀粉的生物合成,对作物产量和品质具有重要影响。综上,这些hub-TFs、ρWGD-hub-TFs以及其调控网络中重要的节点转录因子和基因可能是影响籽粒发育和贮藏物质合成和积累的关键基因,可作为改良作物产量和品质的潜在目标基因。