刷新历史认知:我校衰老机制研究与转化应用厅市共建山西省重点实验室培育基地在真核活细胞基因组中发现数量巨大的主流 DNA:RNA 杂合G-四链体结构
基因组不仅编码了基因,同时也编码了调控元件。这些调控元件可以划分为基于序列和基于结构两大类。G-四链体(G4)是一种在富含鸟嘌呤(G)的核酸中形成的四股链结构,近20-30年来逐渐受到科研界的关注。研究发现 G4 在转录,复制等细胞活动中起重要作用,并参与许多病理过程。可以说作为一种结构调控元件,G4 结构是基因组学的关键组成部分。
G4 结构由四段 G-tract 组成。例如人染色体端粒 DNA 的 4 个 TTAGGG 形成的 G4 是研究最多的 G4 结构。据报道人基因组中具有 4 段相邻 G-tract 的序列有 37 万之多,而且富集在转录起始位点两侧,说明它们与转录的密切关系。G4 的研究历史可追溯至 100 多年前。历史上研究的 G4 基本上都是分子内的 G4,即 4 段 G-tract 均来自一个 DNA 或 RNA 链(图 1,1988 年)。学术界对G4 结构形式的认知主要来自于体外实验。然而,体内环境与体外环境截然不同,了解活细胞中G4 的真实生理结构和形成机制具有重要意义,也是一个挑战。
Dell'Oca MC, et al. (2024) Int. J. Mol. Sci. 25:3162.
衰老机制研究与转化应用厅市共建山西省重点实验室培育基地近期完成的工作发现在活酵母基因组上可以形成由 DNA:RNA 共同组成的hybrid G4(hG4)(图 2)。该研究利用聚合酶遇到 G4 时的暂停特性,以天然 DNA 复制中的冈崎片段(Okazaki fragment, OKF)作为探针,并结合其它技术,在全基因组尺度上检测到了 hG4 结构的形成。
该工作通过分析 OKF 3’末端的停滞峰,揭示了基因组 G4 的若干新特征。首先,基因组中的一个 GG tract 即可形成 hG4(图 3 左)。其次,即使一段 DNA 有四段相邻 G-tract 可以独立形成一个分子内 DNA G4(dG4),它仍然更倾向于形成 hG4(图 3 右)。三是酵母基因组中的 G4 位点数从传统的 38 个增加到了近 60 万个,增加了 1.5 万倍。基因组中大量的 1 段,2 段,3 段,原来认为不能形成 G4 的 G-tract,借助于来自 RNA的 G-tract 也都可以形成 G4。
这一工作揭示了过去长期被忽略但却又是基因组中的最优势的一种 G4 结构,在数量、结构形式、形成机制、分布和功能作用等方面带来了对基因组 G4 的全新认识。一至三段 G-tract 也可以形成 G4 使基因组中的 G4 位点增加了数个数量级。这个特征解释了 G4 的逐步进化选择。hG4 位点的数量之多,使 hG4 成为基因组中丰度最高的结构元件。G4 中不同DNA:RNA 的 G-tract 比例,hG4 与 dG4 结构间的竞争,极大丰富了 G4 的结构多样性和相关功能。特别是 RNA 的参与将基于基因组 G4 结构的调控与转录密切偶联起来,揭示了对 G4 与转录的新特征。这项工作的完成还建立了一个在天然生理条件下检测 G4 形成及其结构形式的方法。审稿人认为这项工作是一个 hG4方面的 groundbreaking study;为基因组的组织和调控open up new avenues;在 G4 领域具有far-reaching implications。
该工作由实验室的任晨霞、段瑞芳和王佳在谭铮的指导下完成,受到了国家自然科学基金(22037004,22377009)和山西省“1331 工程”项目的支持。论文以‘Dominant and Genome-Wide Formation of DNA:RNA Hybrid G-Quadruplexes in Living Yeast Cells’为题,已在《美国国家科学院院刊》(Proc. Natl. Acad. Sci. USA)发表(链接: https://www.pnas.org/doi/10.1073/pnas.2401099121)。
老年健康研究中心 科学技术部