1

2

图示:重复序列对宿主基因组结构和功能塑造示意图


重复序列是哺乳动物基因组中重要的组成部分,分别构成小鼠基因组中的~45%和人类基因组中的50%~70%。由于具有入侵宿主基因组的特性并且缺少相应的功能注释,它们在很长一段时间内被认为是基因组的“寄生虫”或者“垃圾”DNA。近年来,某些重复序列亚类如内源性逆转录病毒(ERV)转座子被报道在胚胎干细胞(ESC)里面起到一定的功能,但整体而言,研究者对于重复序列如何、多大程度地影响其宿主基因组的结构和功能还并不清楚。


首先,该文发现了重复序列在基因组上的非随机分布。SINE,L1和low-complexity重复序列将其相关宿主基因划分为三个主要的功能类别:富含SINE的基因更可能编码与RNA加工,核仁和翻译相关的管家蛋白;富含L1的基因倾向于产生在终末分化细胞中具有特殊功能的蛋白质;Low-complexity重复序列富集基因倾向于编码发育和组织特异性转录因子。这些功能类别特异的基因在不同的发育阶段中差异表达。SINE富集的基因在Zygotic genome activation(ZGA)期间被激活并且在ESC中以高水平表达。富含L1的基因则在早期胚胎发育和ESC中处于转录沉默的状态。Low-complexity重复序列富集基因则在胚胎发育开始处于沉默状态,然而在ESC分化中开始变得活跃。


该文发现重复序列可以为其宿主基因提供大量的转录因子结合位点, 从而参与调控基因的时序性表达。SINE重复序列富集参与活性转录的蛋白因子的结合位点;L1重复序列优先被异染色质蛋白和表观遗传阻遏物靶定。Low-complexity重复序列富集PRC2转录抑制复合物的组分。这些结果支持重复序列将其宿主基因连接入转录调控网络中的作用,以实现一类具有不同功能基因的阶段特异性激活或沉默。此外,该文发现B1和L1两种重复序列截然不同并且互补的细胞核内分布。这暗示着重复序列很可能参与到细胞核内染色质的组织。因此,该文开发了鉴定核仁相关结构域的高通量测序方法:Nucleolar DNA-seq并发现L1重复序列显著地富集在核仁相关结构域中(Nucleolar-associate domain,NAD)。相反地,SINE B1重复序列显著地在这两个核内结构域中缺失,而主要分布在细胞核膜和核仁之间 (nuclear interior),该区域一般认为是促进转录的结构域。


此外,该文发现L1 RNA在 ESC中广泛地与其DNA结合。ESC中L1 RNA的敲低导致富含L1 DNA的染色体片段从非活性结构域迁移到核内部活跃区域。相应地,L1富集基因的表达得到去抑制。这些结果证明了L1 RNA可以传递并促进蕴含在L1 DNA中的基因沉默信息。综上所述,这些结果揭示了基因组重复序列已经深刻地定义,塑造和影响了我们的基因组织、功能和表达。

原文链接:

https://www.cell.com/cell-reports/fulltext/S2211-1247(20)30209-6


本文转自:https://mp.weixin.qq.com/s/1qo6-G2KomnmEkg--cjw9Q