跳到主要内容

CTCF的急性耗竭改变了全基因组染色质的可及性

摘要。

背景

转录因子CTCF在定义拓扑相关结构域边界和维持这些结构域内的染色质环结构方面是不可或缺的,这得到了许多功能研究的支持。然而,CTCF的急性耗竭会减少染色质相互作用,但不会显著改变转录。

结果

在这里,我们系统地整合了多组学数据,包括ATAC-seq、RNA-seq、WGBS、Hi-C、Cut&Run和CRISPR-Cas9存活筛选,以及在内源性CTCF位点携带生长素诱导的降解细胞的深度蛋白质组学和磷酸化蛋白质组学分析。急性CTCF蛋白降解显著地改变了全基因组染色质的可及性。增加的可接近染色质区域通常位于与附近基因转录增强相关的启动子区域和绝缘子位点的ctcf结合位点附近。此外,我们利用CTCF相关的多组学数据建立了一个组合数据分析管道,以发现CTCF的共同调控伙伴。我们成功地确定了40个候选人,包括多个已建立的合作伙伴。有趣的是,在急性CTCF丢失时,许多CTCF共调控因子各自下游基因表达发生改变,但在多组学测量中,它们自身的表达水平并未发生变化,这突出了我们的系统在发现与CTCF介导的转录相关的隐藏共调控伙伴方面的优势。

结论

这项研究强调,CTCF缺失重新连接了全基因组染色质可及性,这在转录调控中起着关键作用。

介绍

ccctc结合因子(CTCF)是一种高度保守的含锌指转录因子,被称为“基因组的编织大师”[1]。它是三维(3D)染色质结构最广泛研究的调节因子。CTCF最初是通过其调节MYC的能力被发现的[2],后来发现它在印迹的H19-IGF2和β-血红蛋白位点上起绝缘体的作用[3,4]。ctcf结合占用在许多已知的染色质结构元件上高度富集,包括染色质环锚点和拓扑相关结构域(TAD)边界[5,6]。一般来说,ctcf介导的染色质环倾向于两个ctcf结合位点以会聚方式定位的模式[7,8,9],并且提出了黏结复合物依赖的环挤压模型来支持这种模式[10,11,12,13,14]。在分子水平上,CTCF的n端结构域与内聚蛋白复合物相互作用,在人和小鼠细胞中通过保护内聚蛋白防止环释放来促进染色质环的形成[15,16]。此外,在CTCF急性耗竭细胞模型以及其他基因敲除模型中,CTCF对于全基因组TAD和TAD内环的形成是不可或缺的[17,18,19,20,21]。

尽管CTCF缺失导致染色质相互作用整体减少,但通过RNA-seq观察到的对mRNA表达的影响并不显著[19,22]。到目前为止,这种差异仍然难以捉摸。为了更好地了解ctcf结合占用如何促进转录调控,我们系统地进行了多组学研究,特别关注染色质可及性。我们之前在mll重排的人B淋巴细胞白血病(B- all)细胞系SEM中建立了一个基因工程细胞工具,允许通过生长素诱导降解(AID)系统急性消耗CTCF蛋白[19]。在CTCF- aid细胞模型中,degron急性诱导CTCF蛋白降解,数据通过一系列下一代测序技术收集:利用测序(ATAC-seq)、全基因组亚硫酸盐测序(WGBS)、转录组RNA测序(RNA-seq)、Hi-C染色体构象捕获、时间解决的深度蛋白质组和磷酸化蛋白质组分析,以及利用核酸酶在靶标下切割和释放的全基因组CTCF占用分析(Cut&Run)。结果,我们发现急性CTCF耗竭直接改变了全基因组染色质的可及性。差异最大的ATAC-seq峰与邻近的CTCF结合位点重叠,证实了CTCF占用与其周围染色质可及性之间可能存在直接联系。增加的ATAC-seq峰与启动子区域和绝缘子位点的转录增加显著相关。减少的峰在DNA环的区域显著富集。我们利用综合数据分析在靶基因远端的非编码区鉴定了67个新的ctcf介导的绝缘子。crispr介导的BLCAP上游一个保守的CTCF结合位点的破坏诱导了转录,这与从CTCF急性耗竭中收集的数据一致。最后,我们发现了40个CTCF共调控伙伴控制不同的下游基因子集,其中许多CTCF共调控伙伴表现出下游基因表达的改变,但没有表现出表达水平的变化,这突出了我们的系统在发现与CTCF介导的转录相关的隐藏共调控伙伴方面的优势。总之,我们提出了一个模型,急性CTCF缺失重新连接全基因组染色质可及性,这在转录调控中起着至关重要的作用。

结果

急性CTCF耗竭改变染色质可及性。尽管许多针对CTCF的粗略功能损失模型已经被广泛研究[17,23,24,25,26,27,28],但不可避免地观察到累积的次要效应。急性蛋白质降解系统最近被发展为研究直接转录调控的重要工具[29,30]。我们之前将双等位基因miniAID-mClover3标签传递到人内源性CTCF位点,并生成了三个CTCFAID细胞克隆[19]。在强力霉素和生长素(IAA)存在下,OsTIR1的强制表达与Skp1/Culin/F-box (SCF)泛素连接酶组分连接,并迅速降解CTCF融合蛋白(图1A)。当强力霉素和IAA完全从培养基中去除后,这种降解是可逆的。我们证实,在IAA处理24小时后,对三个单细胞衍生克隆进行免疫印迹,CTCF被有效降解(图1B和附加文件1:图S1A),这与我们之前在48小时的观察结果相似[19]。

图1
figure 1

急性CTCF耗竭改变染色质可及性。在mll重排的B-ALL SEM细胞中,生长素诱导标记内源性CTCF的degron模型示意图[19]。用慢病毒转染SEM细胞,该慢病毒表达一种编码强力霉素诱导的OsTIR1的转基因基因。将miniAID-mClover3基因盒插入两个内源等位基因中,并与CTCF结合。在强力环素和生长素(IAA)存在下,OsTIR1的强制表达与Skp1/Culin/F-box泛素连接酶组分结合,形成功能性SCF/OsTIR1 E3泛素连接酶复合物,快速降解miniAID-mClover3融合蛋白。B CTCF免疫印迹证实敲除蛋白样本翻译的CTCF- miniaid - mclover3融合蛋白成功降解。以ATAC-seq无核小体峰峰为中心的C热图。CTCF Cut&Run数据表明,增加的DARs具有最强的CTCF结合,而减少的DARs具有较弱的整体CTCF结合,具有双峰(黄色平均剖面曲线在放大区域表示)。USF1/2双敲除SEM细胞的ATAC-seq分析作为阴性对照。D对照NFRs、DARs降低和DARs增加(DARs经fdr校正p值< 0.05,log2倍变化| > 1)时ATAC-seq峰强度(每百万读取的峰的每kb片段数,FPKM)的箱形图。E小提琴图显示了最近的CTCF基序的总距离降低了DARs,增加了DARs,或控制区域。y轴上的物理距离用log10(距离+ 1bp)计算。Wilcox检验**** p值< 0.0001

为了研究CTCF缺失对全基因组染色质可及性的影响,我们对加或不加IAA处理的CTCFAID细胞进行了ATAC-seq分析。将野生型SEM细胞和CRISPR双敲低两个不相关靶标USF1和USF2的SEM细胞作为附加对照(附加文件1:图S1B)。我们在可重复核小体区(NFRs)使用无核小体读取来分析数据。总共有8876个差异可达性区域(DARs)显著降低,8042个差异可达性区域(DARs)显著增加,错误发现率(FDR)控制的p值为0.05,变化为2倍。此外,我们将8440个NFRs指定为对照NFRs,因为在将未CTCFAID处理的细胞与IAA处理的CTCFAID细胞进行比较时,它们没有表现出显著差异(p值> 0.5,fold change < 1.05作为截止值)(附加文件2:表S1)。为了提高分辨率,我们通过在重复中使用最接近峰中心的峰(称为MACS2)来提取每个峰的最佳峰。我们还排除了高峰,如果两个高峰彼此太接近,以避免潜在的工件。之后,我们使用剩余的峰值(8575个DARs下降,7719个DARs增加,8050个控制区域在CTCF损失时没有表现出染色质可及性变化)来生成每个样品的热图和平均剖面以及CTCF切割和运行剖面。热图和峰值强度结果均证实dar具有高度可重复性(图1C、D和附加文件1:图S1C)。此外,考虑到USF1/2和CTCF结合的共识基序完全不同,我们还纳入了从USF1/2敲除中收集的dar,以测试CTCF相关的dar是否对CTCF损失具有特异性。正如预期的那样,这些DARs在热图中的平均分布与CTCF的损失呈现一致的趋势,但在USF1/2敲除的SEM细胞中保持不变,这表明这些DARs表现出CTCF依赖的特征。

为了调查哪些转录因子(tf)与这些dar相关,我们进行了从头基序分析(Homer v4.9.1)[31]。我们的数据表明,CTCF基序是降低dar的最高富集基序(附加文件1:图S2A),而不是增加dar的最高富集基序(附加文件1:图S2B)。使用enrichment服务器的基于基因的染色质免疫沉淀富集分析(ChEA)分析[32]也证实了来自各种细胞类型的CTCF结合位点在减少的dar中被富集(附加文件1:图S2C, S2D)。

DARs在CTCF Cut&Run剖面中表现出高度不同的模式。例如,增加的DARs在亲本细胞中表现出最强大的CTCF结合,而减少的DARs和对照区域都表现出较弱的CTCF结合亲和力。此外,CTCF结合的罕见双峰模式与降低的dar共定位(图1C)。为了进一步证实这种模式,我们使用了较小窗口(500 bp)的k-means聚类。热图证实,增加的DARs和对照NFRs(附加文件1:图S3A, S3B)都没有显示CTCF结合的双峰模式,这在降低的DARs中再次观察到(附加文件1:图S3C)。接下来,我们确定了这些dar与其最近的CTCF基序之间的物理距离。我们的结果表明,减少的dar更接近最近的CTCF基序(p值< 2.2 × 10-16, Wilcoxon检验),中位数距离非常接近0 bp。相比之下,与减少的DARs相比,增加的DARs与CTCF基元的距离明显较远(~ 100 bp) (p值< 2.2 × 10 - 16),但与对照区域(~ 10 kb) (p值< 2.2 × 10 - 16)明显较近(图1E)。

然后,我们确定双顶点模式下的CTCF结合谱是代表每个ATAC-seq顶点的两个等效结合事件,还是由随机分配到ATAC-seq顶点的不平等CTCF结合引起的。我们根据最近的CTCF基序的链重新定位NFR峰会。如果同一峰出现多个基序,我们将该序列分配给位置权重矩阵得分最高的基序。使用这种策略,我们发现CTCF结合偏向于CTCF基序上游的区域(附加文件1:图S4A)。偏签名发生在ctcf -结合亲和力更强的集群1、2和3中,但不发生在ctcf -结合亲和力弱得多的集群4中(附加文件1:图S4B)。这些数据证实了双顶点模式是由于CTCF结合不平等造成的,CTCF以相同的机会随机分配到ATAC-seq顶点。

急性CTCF丢失后染色质可及性特征发生改变。我们全面表征了CTCF缺失后染色质可及性变化对TF占用率的响应。我们扫描了motif数据库TRANSFAC[33]中所有带注释的TF motif,并将它们的富集频率分为三个类别:dar减少区、dar增加区和控制区。正如预期的那样,降低dar的顶级tf是CTCF和黏结蛋白复合物(SMC3和RAD21)(图2A)。Tn5插入位点的足迹分析证实,它们的基序(如CTCF、SMC3和RAD21)在基序中心受到保护(图2C)。这些结果共同表明,DARs的下降反映了CTCF损失的影响。

图2
figure 2

急性CTCF丢失时染色质可及性变化的特征。ATAC-seq基序富集分析的Volcano图比较了对照核小体区(NFRs)和减少的差异可及性区(dar)。Fisher精确测试比较基序频率产生p值和优势比。每个点代表数据库中的一个主题。左上角的圆点表示dar降低时富集的基序。与对照NFRs相比,DARs增加的ATAC-seq基序富集分析的火山图。Fisher精确测试比较基序频率产生p值和优势比。每个点代表数据库中的一个主题。右上角的圆点表示dar增加的基序。顶部基序的C ATAC-seq占用曲线随着dar的降低而增加。最近顶点与中心之间的比值表示保护图案不被Tn5插入的概率。中心较强的下降表明对绑定的信心较高。离中心最近的顶点的高度表示染色质的可及性。我们用于每个足迹分析的匹配motif的数量附加在每个TF motif的末尾。D ATAC-seq占用曲线的顶部motif随着dar的增加而增加。E在环锚点是否与DARs或控制NFRs重叠分组的环上,Hi-C (+IAA与-IAA)归一化接触数的Log2倍变化。***p值< 0.001;****p值< 0.0001,学生t检验。F密度图测量dar到最近TAD边界的距离

CTCF基序也因dar的增加而丰富(附加文件3:表S2),与我们与CTCF基序的距离分析一致(图1E)。然而,最富集的tf不是CTCF基序。相反,许多是与活性转录相关的一般转录因子(GTFs)(图2B, D和附加文件1:图S5A)。我们假设这些DARs的调控很可能与CTCF的抑制功能有关。在野生型细胞中,CTCF通过阻断GTF结合在这些dar上发挥抑制作用。因此,CTCF的缺失允许更多的gtf结合到靶基因启动子上,从而增加染色质的可及性。另外,CTCF的缺失可能会增加染色质的可及性,从而允许更多的gtf结合。事实上,这些区域更有可能被注释为基因启动子(附加文件1:图S6),这与急性髓系白血病细胞系K562的隐马尔可夫模型染色质状态表征一致(附加文件1:图S7)[34,35]。

尽管CTCF和黏结蛋白基序在DARs升高和DARs降低时富集,但它们在DARs升高时的足迹谱显示出不同的模式(附加文件1:图S5B)。与减少的DARs中受tn5保护的基序中心相比,这些基序周围的近侧侧翼区域比这些基序中心受到更多的保护,这与与活性启动子和增强子相关的串联CTCF基序(2xCTSes)一致[36]。我们发现8042个区域中1244个(15.4%)的DARs与2xCTSes重叠,比对照区域(8440个区域中204个,2.4%)更丰富(Fisher精确检验p值< 2.2 × 10-16,优势比= 7.39)或DARs降低(8876个区域中123个,1.38%)。这些2xcses被认为调节染色质环[36]。因此,我们观察到的dar可能与染色质环直接相关。接下来,我们将这些环分成三组,并用不同的标准(Knight-Ruiz归一化)绘制它们的归一化染色质接触数[37]。与增加的DARs重叠的环表现出更多的染色质内接触,而与减少的DARs重叠的环表现出较少的染色质内接触(附加文件1:图S8)。所有三组在CTCF丢失后均显示接触减少。然而,与降低的NFRs重叠的环路上的接触损失(CTCF损失与对照组的log2倍变化)显著高于与控制NFRs重叠的环路(Wilcoxon检验p值= 1.9 × 10-08)和增加的dfrs (Wilcoxon检验p值< 2.2 × 10-16)。与控制NFRs重叠的环路的失联性也明显强于与DARs增加重叠的环路(p值= 0.0034),尽管差异很小(图2E)。总的来说,环的形成可能只反映了CTCF的结合状态,而不是直接调节染色质的可及性。然而,较弱的远端环更容易受到CTCF丢失的影响。最后,我们试图探索这些dar是否与TAD边界有关。我们分别在对照细胞和ctcf缺陷细胞中调用高置信度TAD边界,并合并从Hi-C数据中收集的TAD边界作为推定参考边界(702个区域)[19]。我们发现,对照ATAC-seq峰和减少的DARs与TAD边界的距离分布相似,而增加的DARs总体上更可能出现在TAD边界的远端(图2F)。已知TAD边界在CTCF结合位点和转录活性基因(包括管家基因)中富集。CTCF占据的物理位置似乎与其转录调控密切相关。

富含gc的CTCF结合与DNA甲基化状态高度相关[38,39]。然而,CTCF在DNA甲基化调控中的作用仍存在争议[17,40,41]。我们假设急性CTCF耗竭细胞模型最适合确定全基因组DNA甲基化的即时反应。令人惊讶的是,当我们通过WGBS生成DNA甲基化谱时,我们没有观察到急性CTCF耗尽时全基因组DNA甲基化的变化,这一点通过对每个CpG位点的估计得到了证实。与ATAC-seq和CTCF Cut&Run图谱不同,DARs周围的DNA甲基化水平在对照组和CTCF缺失之间没有差异(附加文件1:图S9A)。接下来,我们调用差异甲基化区域(DMRs),发现只有49个通过阈值的区域可以被认为是显著的(附加文件1:图S9B)。对这些DMRs富集的基序的进一步研究没有发现CTCF或内聚蛋白的任何作用(附加文件1:图S9C),这表明这些DMRs与CTCF占用没有直接关系(附加文件4:表S3)。总之,我们的研究结果表明,急性CTCF丢失不会影响SEM细胞的全基因组DNA甲基化。

ctcf依赖性染色质可及性通过启动子或增强子-启动子环调节基因表达。虽然CTCF在某些基因位点的基因调控中不可或缺,如H19-IGF2、β-血红蛋白、原钙粘蛋白簇和TP53[3,4,42,43],但目前尚不清楚这种转录调控是CTCF的直接作用,还是染色质可及性也起作用。由于增加的DARs富集于基因启动子,我们将NFRs分配给与基因启动子重叠的基因(转录起始位点[TSS]±2 kb)。火山图显示更多的基因启动子被分配到增加的DARs上,而不是减少的DARs(图3A)。接下来,我们计算了分配给DARs的基因数量,这些基因在IAA处理后也通过RNA-seq表现出差异转录。Fisher精确检验显示,DARs越低往往与基因下调相关(p值= 8.607 × 10-07,比值比= 5.45),DARs越高往往与基因表达越高相关(p值= 2.217 × 10-15,比值比= 0.16)。对于表现出一致变化的基因,我们进一步检查了分配给其启动子的ATAC-seq信号,并证实了这种模式与预期一致(图3B)。我们还利用表达水平和ATAC-seq信号z-score (z-score是对表达或ATAC-seq变化独立计算的)制作了一个基于基因的热图,并确认了可重复性模式(图3C)。为了进一步确保阈值标准不会对这些观察结果产生偏差,我们用排名靠前的基因(即前100、前200、前500或前1000)汇编了基因集,并将它们与从msigdb (v7)下载的基因集相结合[44]。我们对组合基因集进行了基因集富集分析(GSEA),对比在IAA处理和未处理的情况下RNA-seq数据的log2倍变化。我们的结果表明,降低的DARs与下调的基因有关,而增加的DARs与上调的基因有关(附加文件1:图S10A-D)。我们还研究了一组解除调控的基因,这些基因在启动子和/或增强子的可及性方面没有变化,但在附近有CTCF结合。在219个上调基因中,只有8个基因启动子具有ATAC-seq控制峰和CTCF结合占用。在269个下调基因中,21个基因启动子(24个ATAC-seq峰)具有ATAC-seq控制峰和CTCF结合占用。因此,我们得出结论,与DARs相关的转录变化特征直接响应CTCF的急性丢失。

图3
figure 3

ctcf依赖性染色质可及性通过启动子或增强子-启动子环调节基因表达。基因启动子染色质可及性变化的火山图。差异ATAC-seq峰定义在ILog2倍变化> 1和调整后p值< 0.05的截止点。共有480个启动子ATAC信号减少的基因和4150个启动子ATAC信号增加的基因。B归一化ATAC-seq信号的基因组热图,以ATAC-seq dar为中心,基因表达变化一致。C CTCF耗尽后变化一致的基因启动子的表达水平和ATAC-seq信号的热图(z-score由表达或ATAC-seq信号独立计算)。D在IAA处理或不处理的CTCFAID细胞中,ATAC-seq轨道的CTCF启动子的截图。平均轨迹是对三个个体克隆的综合分析。E - Q-PCR分析CTCF蛋白缺失24和48 h以及克隆27、35和42三个生物重复水洗后CTCF mRNA的表达

CTCF缺失后,CTCF基因启动子处的染色质可及性也增加(图3D),定量PCR (Q-PCR)进一步验证了这一点(图3E)。这些数据表明CTCF可以抑制自身以维持最佳表达水平。对于已知在CTCF缺失时下调的基因,如MYC[19],我们在启动子区域未检测到统计学上显著的染色质可及性变化(附加文件1:图S10E)。实际上,MYC启动子有四个可重复的ATAC-seq峰。最靠近MYC TSS的一个显著增加并通过了FDR 5%,但没有通过两倍的变化。MYC TSS下游另一个显著升高,但未超过FDR 5%。其他两个没有显著增加或减少,但也没有包括在控制峰中,因为我们要求控制峰的截断值p值> 0.5。然而,我们发现几个CTCF保守结合位点在距离MYC基因约1.8 Mb的远端增强子处显示出dar下降,我们之前从Hi-C数据中发现[19],并表明通过CTCF依赖性增强子-启动子环在SEM细胞中调节MYC(附加文件1:图S10F)。众所周知,在mll重排的白血病细胞系SEM中,由于增强子/启动子环在三维染色质结构上的调控成瘾,MYC的转录调控容易受到CTCF的影响[19]。尽管在CTCF丢失时MYC启动子上的染色质可及性保持不变,但观察到位于MYC增强子远端CTCF结合位点上的ATAC-seq信号显著减少。CTCF的缺失可能会影响增强子结合的tf和表观遗传调控因子的结合占用,从而进一步降低MYC在增强子/启动子环三维环境中的转录。因此,当启动子区域保持开放时,远端增强子区域的染色质景观变得难以接近,并且与CTCF丢失一起,可能在控制调节MYC转录的远端增强子-启动子环形成中发挥作用。

综合分析以探索假定的绝缘体ctcf结合位点

尽管诸如Hi-C, Hi-ChIP和染色质相互作用分析等技术通过配对末端标签测序允许全基因组表征ctcf介导的绝缘子,但在基因组非编码区域对这些ctcf结合绝缘子的系统和功能注释仍然具有挑战性。我们建立了一个框架,通过综合分析来识别这些假定的绝缘体元素。通过将3490个ATAC-seq峰与邻近含有保守CTCF基序的CTCF结合峰重叠,我们发现716个ATAC-seq峰增加(折叠变化> 2,fdr校正p值< 0.05)。接下来,如果tss位于距离DARs 2至50 kb的地方,我们将它们与RNA-seq结果中的上调基因进行匹配(fold change > 2, fdr校正的p值< 0.05)。总之,67个基因通过了这些标准(图4A)。我们发现这67个基因中有20个被Hi-C数据中的染色质环所支持(附加文件5:表S4)。例如,在BLCAP基因上游约7 kb处观察到一个假定的抑制ctcf结合峰,该峰物理上位于Hi-C所示的染色质绝缘环中(图4B)。在未经IAA处理的对照CTCFAID细胞中,CTCF与该基序结合导致染色质可及性受到抑制,这可以通过ATAC-seq信号的缺失来证明。然而,急性CTCF丢失后,ATAC-seq峰值信号和BLCAP mRNA表达均显著升高(图4C)。

图4
figure 4

假定绝缘子ctcf结合位点的综合分析。在靶基因上鉴定67个假定的CTCF绝缘子的综合分析方案。B BLCAP基因和邻近染色质区域的染色质状态表征的截图。包括公开可用的ChIP-seq轨道来注释该区域的转录因子占用。蓝色和橙色条表示Hi-C鉴定的带注释的左和右染色质环锚点。C IAA处理和未处理CTCFAID细胞的BLCAP基因和ATAC-seq轨道周围染色质区域的截图。平均轨迹是对三个个体克隆的综合分析-在IAA处理和未处理的CTCFAID细胞的rna -seq轨迹。包括公开可用的CTCF ChIP-seq轨道,以表明CTCF在该地区的占用情况。来自27号克隆的WGBS轨迹作为阴性对照,因为该区域没有发生甲基化

CTCF对抑制作用的功能验证BLCAP表达式

为了进一步验证所预测的假定绝缘子的作用,我们进行了以下实验来研究这一调节。首先,我们设计了一种靶向BLCAP启动子上游远端非编码区CTCF结合峰内CTCF结合位点(CBS)的引导RNA。将表达慢病毒的引导RNA感染到表达cas9的SEM细胞中,然后选择抗生素。Sanger基因组测序(Inference of CRISPR Edits, ICE)在靶池群体中检测到约61%的总体indel频率(图5A),这导致与非靶向引导对照(sgNT)相比,BLCAP mRNA表达显著增加(图5B)。另外,由于在BLCAP启动子上游的远端非编码区只有一个CTCF结合峰,我们认为CTCF蛋白的急性缺失应该提供一个互补的结果,以支持CTCF/BLCAP轴的功能调节。我们用IAA处理CTCFAID细胞24和48 h,然后冲洗IAA以恢复CTCF。我们通过RNA-seq分析和Q-PCR验证来检测CTCF蛋白急性缺失时BLCAP的mRNA表达(图5C)。正如预期的那样,在生长素处理CTCF蛋白24h或48h后,BLCAP表达水平显著升高。更重要的是,生长素被洗去后,表达水平恢复到亲本细胞的水平(图5D)。综上所述,这些数据有力地支持了CTCF占据BLCAP调控区域作为控制BLCAP表达的功能性绝缘子。为了进一步证实其他基因座对抑制作用的转录调控,我们使用针对CTCF急性缺失后CTCF结合基序染色质可接近性增加的候选基因的特异性引物进行了Q-PCR。我们用IAA处理CTCFAID细胞24和48 h,然后冲洗IAA进行CTCF抢救。我们观察到随机选择的候选基因,包括TMEM173、MRXA7、STAT3和STAT5A对CTCF降解的诱导一致。当CTCF蛋白响应IAA缺失而恢复时,转录完全恢复到亲本对照细胞的水平(附加文件1:图S11)。这些数据表明,我们的联合分析在识别新的抑制ctcf结合位点方面是可靠的。

图5
figure 5

CTCF抑制BLCAP表达的功能验证。收集表达cas9的sgRNA抗CBS的SEM细胞,进行基因组PCR和Sanger测序。通过CRISPR编辑推断(ICE)评估Indel频率。利用BLCAP mRNA引物在sgBLCAP-CBS靶群体和sgRNA-NT对照中进行B Q-PCR。C通过RNA-seq定量CTCF丢失后BLCAP mRNA的变化。采用D - Q-PCR方法验证生长素处理CTCF蛋白24、48 h和冲洗后,BLCAP mRNA表达对CTCF蛋白急性耗竭的响应。*p值< 0.05;**p值< 0.01;****p值< 0.0001。学生t检验

多组学整合揭示了CTCF的共同调控伙伴

为了进一步研究急性CTCF丢失对基因表达的影响,我们系统地探索了CTCF在蛋白质组和磷蛋白质组水平上介导的下游基因表达,并将其与ATAC-seq和RNA-seq相结合(图6A)。我们还纳入了从dropout CRISPR/Cas9筛选中收集的数据,通过靶向1639个转录因子,无偏地揭示SEM细胞中的生存依赖基因(附加文件1:图S12和附加文件6:表S5)[45]。通过先进的TMT-LC/LC-MS/MS平台,与对照细胞相比,在12、24和48小时对CTCFAID进行了时间分辨深度蛋白质组学分析(附加文件1:图S13A)[46、47、48、49、50、51],获得了高质量和深度的蛋白质组学和磷酸化蛋白质组学数据(附加文件1:图S13B-E)。通过与未使用IAA处理组进行24 h的比较,我们共鉴定出10317个和11,924个定量蛋白和磷酸化中,有2550个差异表达蛋白(1183个向下,1367个向上)和1895个差异表达肽(994个向下,901个向上),FDR值分别< 0.05(图6B和附加文件1:图S13F)(附加文件7:表S6)。虽然我们观察到整体蛋白质组和转录组之间存在合理的相关性(r = 0.56)(图6C),但只有488个DE mrna(269个向下,219个向上)通过了FDR < 0.05的截止值(附加文件8:表S7)。这些数据表明,尽管mRNA水平的变化并不强烈,急性CTCF丢失会导致大量的下游中断,这在差异蛋白表达和磷酸化中观察到。

图6
figure 6

多组学整合揭示了CTCF在调控下游基因表达中的主要共调控伙伴。包括CRISPR dropout筛选、ATAC-seq、RNA-seq、蛋白质组学和磷酸化蛋白质组学在内的多组学分析方案,共有1639个tf、132,266个dar、11,119个mrna、10,317个蛋白和11,924个磷酸肽。B各数据集DE分析摘要。C在CTCF急性丢失时,与DE mrna相比,鉴定出更多的DE蛋白。散点图显示CTCF急性丢失24小时后蛋白质(x轴)和mrna (y轴)的log2倍变化。标记Pearson相关系数和代表性基因名。多组学整合揭示的CTCF共调控tf。热图显示(1)CTCF伴侣tf的下游DE基因在RNA和蛋白质水平上的富集(FDR)显示上调或下调(红色)。(2) DE分析的FDR值比较了这些tf在急性CTCF丢失组与对照组在转录组、蛋白质组和磷蛋白质组数据中的表达(紫色)。(3) DAR降低和DAR升高时TFs的富集(Log2 odratio)(蓝色)。(4) SEM细胞CRISPR-Cas9 dropout筛选中鉴定的生存必需基因(星号)。E CTCF和ZBTB7A结合基序之间的物理距离在增加、减少和控制dar中计算,归一化到峰值大小。F CTCF和YY1结合基序之间的物理距离在增加、减少和控制dar中计算,归一化到峰值大小。G CTCF与阴性对照DUX4结合基序之间的物理距离在增加、减少和对照dar内计算,并归一化到峰值大小。学生t检验

与免疫印迹和Q-PCR结果一致,基于质谱(MS)的蛋白质组学和RNA-seq分析证实,在急性CTCF缺失后,CTCF在蛋白质水平上的表达大幅减少,而在mRNA水平上的表达增加。虽然CTCF的缺失在SEM细胞中是致命的[19],但其分子网络尚未得到系统的研究。因此,为了探索CTCF介导的主要转录程序并利用其重新连接下游分子网络变化,我们开发了一种多组学整合方法来定义CTCF共调控转录因子。我们首先要求CTCF共调控伙伴在CTCF丢失时显著富集一个不受调控的下游基因,该基因在RNA和/或蛋白质水平上上调或下调。我们进一步将这些tf限制为具有MS检测支持的蛋白水平表达证据的tf。在CTCF丢失时,通过mRNA、蛋白和/或磷酸化的变化进一步确定已鉴定的tf的优先级。总的来说,我们确定了40个CTCF共调控伙伴tf,这些tf在急性CTCF丢失时显著影响其下游靶基因的mRNA和/或蛋白质水平表达(图6D)。我们进一步将这些合作伙伴分为两类。(1)明显的主共调控伙伴在RNA、蛋白质或磷酸化水平上都有表达改变,包括MYC、E2F4、TCF3和STAT3。例如,在CTCF缺失后,表征良好的CTCF共调控伙伴MYC[19]的mRNA和蛋白水平显著下降,其下游基因在IAA处理后也出现了最显著的下调(24 h富集FDR < 1 × 10 - 72, 48 h富集FDR < 1 × 10 - 178)。此外,在急性CTCF丢失时,MYC的结合位点在CTCF介导的dar中显著富集,这表明它可以与CTCF协同作用;(2)隐藏的主伴侣,在急性CTCF耗竭后,其表达没有明显差异,但其各自的下游基因靶标(如YY1、TAF1、USF2、NFYB、NFYA、NRF1、E2F1和SP1)表现出实质性的蛋白质组学变化。正如预期的那样,这40个CTCF共调控伙伴中的大多数也在CTCF介导的dar中共定位,证实了它们与CTCF的潜在直接共调控作用。此外,我们还研究了CTCF与候选tf ZBTB7A和YY1的共调控模式。我们假设,如果CTCF的急性缺失损害了染色质可及性和邻近的TF结合,我们应该能够在一个基因座子集内检测到这两个结合基序的接近性。为此,计算CTCF结合基序与ZBTB7A或YY1基序之间的总距离。数据表明,CTCF/ZBTB7A和CTCF/YY1基序的物理距离在降低的dar中明显更近(小于100 bp, p < 2.2 × 10-16)。作为阴性对照,CTCF和DUX基序之间没有观察到这种模式(p = 0.47)。值得注意的是,与CRISPR-Cas9文库中完整的TFs列表(1639个TFs)辍学筛选(Fisher精确检验p = 0.0237)相比,CTCF共调控TFs列表中生存必需基因(即MYC、MAX、YY1、USF2、NRF1、ZNF384、ZBTB7A、SP1)显著富集(这表明它们在CTCF介导的下游分子网络调控中发挥着不可或缺的作用,支持基本的细胞和分子功能。为了进一步确认CTCF与上述多组学研究发现的隐藏tf之间潜在的共调控功能,在每一类dar中,计算CTCF/ZBTB7A与CTCF/YY1之间的物理距离。数据表明,绝大多数两个基序在降低的dar和增加的dar上都比对照组更接近,这表明CTCF的丢失可能会影响相邻开放染色质的可及性,从而导致与其他tf的结合丧失(图6E, F)。作为阴性对照,DUX4和CTCF基序距离分布均匀(图6G)。总之,我们系统地揭示并验证了CTCF介导和招募的主要共调控伙伴tf,通过编织和改变染色质可及性来完成下游转录调控,并证明了我们的多组学管道在识别不显示表达变化的隐藏主调控因子方面是强大的。

讨论

尽管最近在了解CTCF生物学方面取得了进展,但由于缺乏足够的研究工具,几个方面仍未解决。CTCF单倍体不足会破坏DNA甲基化的稳定性[17],CTCF可以与TET酶相互作用,从而在脂肪细胞分化过程中促进成脂转录增强子的DNA甲基化[52]。前列腺癌细胞中CTCF的敲低导致CTCF结合位点的超甲基化[40]。相比之下,CTCF结合据报道是DNA甲基化依赖的[17,38,53],这进一步得到了结构分析的支持[54]。这两种调节功能中的一种是否比另一种更适用于全基因组尚不清楚。染色质可及性通常与DNA甲基化水平呈负相关[55,56]。在HCT116细胞中,DNMT1和DNMT3B双敲除后,DMRs表现出更高的染色质可及性,并富含CTCF基序[57]。这与一篇报道一致,p63突变型角质形成细胞中减少的dar富含CTCF基元,从而减少CTCF结合[58],进一步表明CTCF调节染色质可及性。然而,另一份报告表明BATF是一个可以调节染色质可及性的先驱因子。然而,BATF能否直接与DNA结合并招募CTCF尚不清楚[59]。事实上,目前尚不清楚CTCF是否直接调节染色质可及性,或者染色质可及性是否在转录前控制CTCF的结合。无论他们支持哪种机制,这些研究大多严重依赖于CTCF的粗敲除,导致CTCF缺失细胞在长期扩增过程中对转录的混合继发性影响。

使用最先进的急性CTCF降解系统和丰富的可用数据集,我们提供了CTCF调节染色质可及性而不是DNA甲基化的直接证据。这些数据通过将CTCF的直接效应与其下游效应解耦,成功地填补了知识空白。我们的研究结果揭示了CTCF发挥多种分子功能的机制。据我们所知,这是第一个显示CTCF丢失后dar降低的位点显示出与CTCF基序取向相关的串联CTCF结合模式的报告。这些数据也支持CTCF和CTCFL/BORIS共存的地方最有可能发生转录调控的假设[36]。由于CTCF和CTCFL似乎不会相互招募[60],CTCF可能在串联CTCF结合位点维持染色质可及性,从而招募CTCFL到附近基因并启动转录。相比之下,大多数基因启动子由于组合TF结合而高度耗尽核小体。在这些位点上,CTCF结合的缺失不会完全关闭转录。有趣的是,Owens等人最近的一项研究也表明,CTCF在DNA复制后和有丝分裂期间赋予局部核小体弹性[28],这可以支持CTCF在改变染色质可及性和其他gtf结合方面的潜在作用。

我们还发现,先前报道的2xCTSes (~ 33 bp)[19]串联CTCF位点之间的距离比减少的DARs (~ 200 bp)短。这解释了增加的dar所增加的2xcses数量和我们的双底足迹概况的发现。对于很少有TF结合的位点,CTCF可能仅为有限的核小体占用创造屏障,从而允许TF进入染色质。相反,对于具有许多假定的tf或Pol II结合的位点,如启动子,CTCF不能与多个tf竞争。总之,我们的数据为高度保守的TF(如含锌指的CTCF)如何通过微调串联基序的距离来表现出多种调控功能提供了一种简化而有效的策略。这加快了我们对CTCF和其他二聚体/四聚体因子(如STAT5A)功能的理解[61]。此外,已建立的框架和多组学数据集可能对研究界广泛有用。

虽然CTCF的急性缺失会严重干扰整体染色质相互作用和可及性,但转录通常不会发生显著改变[19,22]。我们将分子分析扩展到转录组之外,以表征蛋白质组和磷蛋白质组的变化。基于质谱技术的最新进展使得对几乎所有有信心表达的转录物的蛋白产物进行深入分析成为可能[48,62,63,64,65,65,66],通过多组学整合分析,为系统表征由转录、翻译和翻译后修饰引起的分子表型提供了前所未有的机会[46,47,49,51,67,68,69]。通过先进的TMT-LC/LC-MS/MS蛋白质组学方案[48,63,64,65,66],我们定量分析了所有样品中> 10,000个蛋白质和大约12,000个磷酸基,发现2550个DE蛋白在CTCF丢失24小时后FDR < 0.05,与DE mrna数量相比变化超过5倍。此外,我们还发现了1895蛋白磷酸化变化,FDR < 0.05。总之,这些发现表明,在CTCF急性丢失时,蛋白质翻译和翻译后修饰过程中发生了潜在的全局变化。急性CTCF丢失可能破坏了翻译中的主要成分,从而使蛋白质翻译机制脱轨。事实上,我们发现核糖体生物发生相关的术语是在CTCF丢失时通过GSEA对转录组和蛋白质组进行分析后最显著改变的GO注释(数据未显示)。该研究的一个局限性是,大量mRNA测序可能受到差异mRNA稳定性和周转的限制。先进的新生转录本测序方法,如NET-seq,应该能够解决这个问题。总之,CTCF的急性缺失在全球范围内改变了染色质相互作用和可及性。虽然转录变化并不明显,但我们观察到强烈的蛋白质表达和翻译后修饰变化。需要进一步的研究来更好地了解CTCF的缺失如何导致蛋白质和翻译后修饰的巨大变化。

我们和其他人证明CTCF的长期缺失会导致大量细胞死亡[19],强调了其在维持细胞完整性方面不可或缺的作用。本研究进一步揭示CTCF主要通过改变急性丢失时染色质相互作用和可及性来实现其功能;然而,CTCF的下游基因几乎没有改变,表明其作为转录因子的作用较小。我们假设,急性CTCF缺失引发的染色质可及性和相互作用的全局变化将导致其他主转录因子的重新定位、切换和基因组综合占用重编程,从而进一步改变这些TF的下游基因表达。因此,确定这些CTCF共同监管伙伴至关重要。通过多组学整合方法,我们确定了40个CTCF共调控伙伴tf,它们在急性CTCF丢失时在mRNA和/或蛋白质水平上对下游靶标进行了显著的重编程。值得注意的是,在CTCF缺失时,这40个tf中的大多数在DARs中显示出基序的富集,我们的CRISPR-Cas9 dropout筛选进一步验证了它们的功能重要性,在SEM中突出了这40个伴生tf中必需存活基因的显著富集。我们期待共同监管的合作伙伴可以通过多种方式与CTCF合作。例如,直接结合可能发生在减少的DARs中,间接相互作用和占用转换最好发生在增加的DARs中;这些不同的机制以位点依赖的方式存在,并且在不同的位点上,相同的tf可能出现多种机制。我们观察到,在40个检测到的共调控伙伴中,许多下游基因在上调和下调的池中都有富集,这支持了不同位点上的相同tf与CTCF合作的独特机制的可能性。最重要的是,我们的数据揭示了CTCF影响协同调节因子与靶基因结合亲和力的能力,这在以前的研究中被低估了。然而,需要在未来的功能验证来证实这些观察结果。

我们也承认,在CTCFAID敲入克隆中,生长素处理后可以检测到残留的CTCF蛋白。例如,虽然CTCF蛋白在免疫印迹检测中似乎完全消失,但流式细胞术和CUT&RUN仍然可以检测到一些阳性信号。有许多可能的解释来解释这一观察结果。Gerd Blobel博士的研究小组最近报道,生长素治疗后保留了极少量的染色质结合的CTCF[70]。另外,OsTir1不同拷贝的随机整合可能导致OsTir1表达水平的变化。最后,基因工程CTCFAID系的克隆变异也可能导致蛋白质的不完全降解。为了减轻这一挑战,需要一种更强大的急性耗竭系统,这是目前我们所知的。

总之,我们通过系统整合ATAC-seq、RNA-seq、Hi-C、Cut&Run、CRISPR-Cas9 TF库dropout筛选以及基于ms的深层蛋白质组学和磷酸化蛋白质组学数据,揭示了许多CTCF的共调控伙伴,极大地拓宽了我们对CTCF介导的转录网络的理解。CTCF与这些伙伴之间相互作用的机制和功能后果值得在其他系统中进一步研究。最后,从急性CTCF降解模型中收集的丰富的下一代测序数据将为研究界提供宝贵的资源。

材料与方法

细胞培养

先前有研究建立了携带双等位基因miniAID-mClover3敲入标签的人B-ALL细胞系SEM (DSMZ)[19]。3个单细胞衍生克隆(克隆27,35和42)在含有10%胎牛血清(Hyclone), 2mm谷氨酰胺(Sigma)和1%青霉素/链霉素(Thermo Fisher Scientific)的rpm -1640培养基(Lonza)中维持。USF1/USF2双敲除SEM细胞是通过我们之前研究中描述的两种经过验证的引导rna (sgUSF1: 5 ' - CTATACTTACTTCCCCAGCA-3 ';sgUSF2: 5 'agaagagcccagcacaacga3”)44。BCLAP-CBS靶向池群体是通过将引导RNA (5 ' - AGGTCTGTGGTGACACCTAA-3 ')传递到表达cas9的SEM细胞系中产生的。所有细胞均为支原体感染阴性,经短串联重复序列分析证实其身份。

免疫印迹

在RIPA缓冲液中制备细胞裂解液,进行SDS-PAGE (Thermo Fisher Scientific),并在100 V下转移到PVDF膜(Bio-Rad)上1小时。阻断后,膜与5%脱脂乳在含GAPDH (Thermo Fisher Scientific, AM4300, 1:10 000)、USF1 (Proteintech, 22327-1-AP, 1:2000)、USF2 (Novus, NBP1-92649, 1:2000)和CTCF (Abcam, ab70303, 1:1000)抗体的TBS-T (10 mM Tris, pH 8.0, 150 mM NaCl, 0.5% Tween-20)中在4°C下轻摇12 h。在室温下,用1:2000稀释的辣根过氧化物酶偶联的抗小鼠或抗兔抗体孵育2小时。用TBS-T洗涤3次,30分钟,并用ECL系统(Amersham Biosciences)进行显影。

Auxin-induced退化

3个单细胞敲入克隆(克隆27、35和42)分别在添加500 μM IAA (Sigma)的完整培养基中处理24 h和48 h,诱导CTCF降解。将细胞在PBS中离心重悬三次,然后在不含IAA的常规培养基中培养48 h,进行IAA洗脱。

实时定量PCR

使用高容量cDNA逆转录酶试剂盒(Applied Biosystems, 4374966)进行反转录。采用FAST SYBR Green Master Mix (Applied Biosystems, 4385612)进行实时Q-PCR,特异引物扩增CTCF、BLCAP、MEM173、MXRA7、STAT3、STAT5A和GAPDH。采用ΔΔCT方法测定相对基因表达量[71]。

ATAC-seq协议和数据分析

简单地说,每个样品一式收集75,000个细胞,并在含有蛋白酶抑制剂的冷PBS中重悬。在4°C下500rpm离心5min后(Eppendorf 5417R冷冻离心机),将细胞球重悬于含有蛋白酶抑制剂(10 mM Tris pH 7.4, 10 mM NaCl, 3 mM MgCl2和0.1% IGEPAL)的冷裂解缓冲液中,然后离心。将微球重悬于25 μL Tagment DNA Buffer (Nextera, FC-121-1030)中,直接用于转位反应。将Nextera Tn5 (Nextera, FC-121-1030)加入重悬细胞核中,37℃孵育30 min。转位后,使用Qiagen MinElute PCR纯化试剂盒(Qiagen, 28004)纯化DNA。如前所述[72],用NEBNext HiFi 2X PCR Master Mix (NEB, M0541S)和引物进行了12个循环的引物标引PCR。PCR产物采用1:3比例的agcourt AMPure XP珠(Beckman Coulter, A63881)纯化,并使用Illumina HiSeq 4000系统对样品进行100 bp配对端测序。为了进行计算分析,使用cutadapt软件(v1.9,对端模式,默认参数为“-m 6 -O 20”)为Nextera适配器修剪reads,并使用BWA软件(v0.7.12-r1039,默认参数)将reads与人类基因组hg19 (GRCh37-lite)对齐[73]。然后用biobambam2 (v2.0.87)标记重复的读段,samtools(参数“-q 1 -F 1804,”v1.2)只保留未重复的正确配对读段[74]。在去除线粒体DNA片段后,根据片段大小将其余的片段分为四组:无核小体和单核小体、二核小体和三核小体。利用中心的80 bp片段生成了bigwig文件,并将其扩展到2000万个无核小体读取。我们在整合基因组观察器(Broad研究所)上观察到合理的无核小体峰和单核小体、二核小体和三核小体峰围绕无核小体峰的模式。所有样品均表现出双倍的ENCODE标准。因此,我们的结论是数据显示了足够的深度。考虑到所有样本都显示出超过1500万个无核小体片段,我们相信大多数强NFRs没有被遗漏。MACS2对无核小体读取(v2.1.1.20160309,默认参数为“——extsize 200 - nommodel”)进行峰值调用[75]。为了确保数据的可重复性,如果在一个合并样本中以严格的截止值(mac2 -q 0.05)调用,并且在另一个合并样本中至少以较低的截止值(mac2 -q 0.5)调用,我们将每个组的峰值最终确定为保留峰。可重复的峰进一步在组之间合并,以创建一组最终的参考染色质可访问区域。然后,我们使用bedtools (v2.24.0)对每个样本中与参考区域重叠的核小体无游离reads进行计数[76]。重复间的Spearman相关系数> 0.9,且大于不同组间的样本间变异,重复性最佳。为了阐明dar,我们将原始核小体无读计数归一化,用于修剪m值归一化方法的平均值,并在线性拟合后应用经验贝叶斯统计检验(R 3.23, edgeR 3.12.1, limma 3.26.9)[77]。采用fdr校正的p值< 0.05 (Benjamini-Hochberg程序)提取dar,折叠变化> 2。对照NFRs采用截断p值> 0.5和折叠变化< 1.05(无变化)。为了检测富含tf的dar,我们使用MEME套件(v4.11.3)[78]中的FIMO(参数“—motif-pseudo 0.0001—thrresh 1e-4”)扫描TRANSFAC motif数据库[33]。对于每个基序,我们计算有多少DAR或控制区域有基序匹配,并使用Fisher精确测试来估计它们在背景(DAR或没有基序匹配的控制区域)上的富集程度。对于富集的顶级图案,我们还使用deeptools2 (v2.5.7)执行足迹分析[79]。ATAC-seq峰的质量控制分析和motif分析见附加文件3:Table S2。

亚硫酸氢盐全基因组测序和分析

用PureLink Genomic DNA Mini试剂盒(Thermo Fisher Scientific)提取IAA处理或不处理24 h的克隆27的基因组DNA。大约2 μg的基因组DNA用于亚硫酸氢盐DNA转化,随后使用EpiTect快速亚硫酸氢盐转化试剂盒(Qiagen)对转化的DNA进行清理,然后进行文库构建和下一代测序。FASTQ测序文件首先通过去除带有trimgalore的适配器序列进行裁剪,并通过BSMAP (v2.74,参数“-m 17 -x 600 -u -R -z 33 -f 5 -g 3 -R 0 -p 6”)定位到人类基因组(hg19)[80]。然后用BSMAP包中的methration .py提取CpGs。然后,我们确定了最佳深度(每个样本> 9亿reads),覆盖率(> 95%的CpG超过5个reads, > 90%的CpG超过10个reads)和C > T转化率(> 90%)。使用Bioconductor软件包DSS[81]和定制R脚本识别DMRs,甲基化比率变化阈值> 0,p值≤0.01作为截止值。DMR最小长度为50 bp,最小CpG位点数为3个。DMR信息在附加文件4:表S3中提供。

一个辍学的CRISPR筛选数据分析

在SEM细胞中进行dropout CRISPR筛选,针对1639个人转录因子,每个基因设计7个sgrna[45]。在第0天和第12天分别收集经合并sgRNA文库感染的表达cas9的SEM细胞(m.o i = ~ 0.3),对后期差异表达的sgRNA进行测序。这种筛选的基本原理是基于这样一个事实,即与第0天相比,针对基本生存基因的sgrna的读取计数将在第12天耗尽。在MAGeCK分析的指导下,根据MAGeCK评分的截止值小于0.01,有117个tf被确定为必需生存基因。完整的基因列表可在附加文件7,表S6中找到。

全蛋白质组和磷蛋白质组分析的深度分析

来自4个处理组(无IAA、+ IAA 12小时、+ IAA 24小时和+ IAA 48小时)的200万个CTCFAID SEM细胞,每个处理组有3个重复,使用完善的方案进行深度蛋白质组学和磷酸化蛋白质组学分析[48,65,66]。简单地说,细胞在新鲜的裂解缓冲液中裂解(50 mM HEPES, pH 8.5, 8 M尿素,1× PhosStop磷酸酶抑制剂,0.5%脱氧胆酸钠)。蛋白质通过BCA蛋白测定法(Thermo Fisher Scientific)进行定量。每个样品中约100个μg蛋白用Lys-C (Wako, 1:100 w/w)酶切2 h,用50 mM HEPES缓冲液稀释4倍后,在室温下胰酶(Promega, 1:50 w/w)酶切过夜。从每个样品中得到的肽被脱盐,用TMTpro试剂标记,并均匀地汇集。然后对混合后的样品进行基于tio2的磷酸化蛋白质组学富集,并进一步对流过的样品进行脱盐处理,然后进行离线碱性- ph分馏。肽通过2 h梯度分离成80个部分,其余部分干燥并在5%甲酸中重组用于质谱分析。肽段在填充1.9 μm C18树脂(Dr. Maisch GmbH, Germany)的20 cm × 75 μm柱上分离,55°C加热后,在Orbitrap HF质谱仪(Thermo Fisher Scientific)上分析。通过2 h ~ 15-40%缓冲液B(0.2%甲酸,65% CAN, 3% DMSO)梯度实现肽分离。质谱仪设置为DDA模式,分辨率为60000,目标为1 × 106 AGC,最大离子时间为50ms, MS1为Top 10,目标为1 × 105 AGC,最大离子时间为105ms,隔离窗口为1m /z,偏移量为0.2 m/z, MS2为38 NCE,动态排除时间为15s。蛋白质组学数据通过混合JUMP软件套件进行处理,以提高灵敏度和特异性[63,64]。简单地说,在Uniprot人类数据库中搜索原始文件,并使用相同的搜索和过滤参数,使用目标诱饵方法获得1%蛋白质或磷酸肽的FDR[82]。详细的表达数据见附加文件7:Table S6。

统计分析

采用GraphPad Prism 6.0软件对2个或3个独立生物重复的Q-PCR数据进行双尾t检验。使用R进行Fisher精确检验和Wilcoxon检验。使用R (ggplot2、ggpubr或ggally)、deeptools或Excel绘制图表。

数据和材料的可用性

本研究中产生的所有质粒都将沉积到Addgene中。ATAC-seq和WGBS采集的原始数据沉积在NCBI GEO (GSE153237[83])。本文引用的公开数据集为GSE120781[84], GSE126619[85], GSE138862[86]。支持本研究结果的原始蛋白质组学数据存放在ProteomeXchange (Accession: PXD026484[87])。

参考文献。

  1. Phillips JE, Corces VG。CTCF:基因组编织大师。细胞。2009;137(7):1194 - 211。https://doi.org/10.1016/j.cell.2009.06.001。

    文章PubMed PubMed Central Google Scholar

  2. 李建军,李建军,李建军,等。一种异常保守的转录抑制因子CTCF,利用锌指的不同组合结合鸟类和哺乳动物c-myc癌基因的不同启动子序列。中华生物医学工程学报,1996;16(6):562 - 562。https://doi.org/10.1128/MCB.16.6.2802。

    文章CAS PubMed PubMed Central Google Scholar

  3. Singh P, Lee D-H, Szabó PE。不仅仅是绝缘体:CTCF在H19-Igf2印迹结构域的多重作用。2 .《前沿杂志》,2012;https://doi.org/10.3389/fgene.2012.00214。

  4. 李建军,李建军,李建军,等。Laat Wd: CTCF介导β-珠蛋白位点的远程染色质环和局部组蛋白修饰。基因学报,2006;20(17):2349-54。https://doi.org/10.1101/gad.399506。

    文章CAS PubMed PubMed Central Google Scholar

  5. 王春涛,王志强。CTCF:连接基因组拓扑结构和功能的结构蛋白。学报,2014,15(4):234-46。https://doi.org/10.1038/nrg3663。

    文章CAS PubMed PubMed Central Google Scholar

  6. 三维基因组结构:参与者和机制。中华生物医学工程学报,2015;16(4):245-57。https://doi.org/10.1038/nrm3965。

    文章CAS PubMed谷歌学者

  7. de Wit E, Vos Erica SM, Holwerda Sjoerd JB, Valdes-Quezada C, Verstegen Marjon JAM, Teunissen H,等。CTCF结合极性决定染色质环。生物质化学工程,2015;60(4):676-84。https://doi.org/10.1016/j.molcel.2015.09.023。

    文章CAS PubMed谷歌学者

  8. 郭勇,徐强,Canzio D,寿军,李军,Gorkin David U,等。CRISPR对CTCF位点的反转改变了基因组拓扑结构和增强子/启动子功能。细胞。2015;162(4):900 - 10。https://doi.org/10.1016/j.cell.2015.07.038。

    文章CAS PubMed PubMed Central Google Scholar

  9. Rao SSP, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT,等。千碱基分辨率的人类基因组三维图揭示了染色质环的原理。细胞。2014;159(7):1665 - 80。https://doi.org/10.1016/j.cell.2014.11.021。

    文章CAS PubMed PubMed Central Google Scholar

  10. 李建军,李建军,李建军,李建军。染色体结构域的克隆与分析。生物医学进展,2016;15(9):2038-49。https://doi.org/10.1016/j.celrep.2016.04.085。

    文章CAS PubMed PubMed Central Google Scholar

  11. Gassler J, brand o HB, Imakaev M, Flyamer IM, Ladstätter S, Bickmore WA,等。黏结蛋白依赖的环挤压机制组织合子基因组结构。Embo [j] . 2017;36(24): 3600-18。https://doi.org/10.15252/embj.201798083。

    文章CAS PubMed PubMed Central Google Scholar

  12. 刘建军,刘建军,刘建军,刘建军。染色质组织由环挤压和区隔分离的相互作用。自然科学进展,2018;35(6):693 - 693。https://doi.org/10.1073/pnas.1717730115。

    文章CAS PubMed PubMed Central Google Scholar

  13. 罗利·MJ,科塞斯·VG。三维基因组结构的组织原则。学报,2018;19(12):789-800。https://doi.org/10.1038/s41576 - 018 - 0060 - 8。

    文章CAS PubMed谷歌学者

  14. 谢志强,陈志强,陈志强,陈志强,陈志强,陈志强,陈志强,陈志强。中国生物医学工程学报,2016,38(5):559 - 559。

  15. 李勇,Haarhuis JHI, Sedeño cacatore Á, Oldenkamp R, van Ruiten MS, Willems L,等。黏结- ctcf锚定环的结构基础。大自然。2020;578(7795):472 - 6。https://doi.org/10.1038/s41586 - 019 - 1910 - z。

    文章CAS PubMed PubMed Central Google Scholar

  16. Pugacheva EM, Kubo N, Loukinov D, Tajmul M, Kang S, Kovalchuk AL,等。CTCF通过依赖于n末端结构域的内聚蛋白保留介导染色质环。中国科学:自然科学进展,2020;17(4):2020 - 31。https://doi.org/10.1073/pnas.1911708117。

    文章CAS PubMed PubMed Central Google Scholar

  17. Kemp CJ, Moore JM, Moser R, Bernard B, Teater M, Smith LE,等。CTCF单倍体不足会破坏DNA甲基化的稳定性,使其易患癌症。细胞生物学杂志,2014;7(4):1020-9。https://doi.org/10.1016/j.celrep.2014.04.004。

    文章CAS PubMed PubMed Central Google Scholar

  18. 陈旭,柯毅,吴坤,赵宏,孙毅,高磊,等。CTCF在人类胚胎染色质结构建立中的关键作用。大自然。2019;576(7786):306 - 10。https://doi.org/10.1038/s41586 - 019 - 1812 - 0。

    文章CAS PubMed谷歌学者

  19. Hyle J,张勇,Wright S,徐波,邵勇,Easton J,等。CTCF的急性缺失通过增强子-启动子环的缺失直接影响MYC调控。核酸学报,2019;47(13):6699-713。https://doi.org/10.1093/nar/gkz462。

    文章CAS PubMed PubMed Central Google Scholar

  20. Nora EP, Caccianini L, Fudenberg G,等。基因组折叠中CTCF结合极性的分子基础。自然科学。2020;11(5612)。https://doi.org/10.1038/s41467 - 020 - 19283 - x。

  21. 李建军,李建军,李建军,等。CTCF介导β -珠蛋白位点的远程染色质环和局部组蛋白修饰。基因学报,2006;20(17):2349-54。https://doi.org/10.1101/gad.399506。

    文章CAS PubMed PubMed Central Google Scholar

  22. 张建军,张建军,张建军,张建军,张建军,张建军,张建军,张建军,张建军,张建军,张建军,张建军。细胞学报,2017,49 (9):930-944.e922。

  23. 张建军,李建军,张建军,等。CTCF调节胸腺αβ T细胞的细胞周期进程。中华微生物学杂志,2008;27(21):2839-50。https://doi.org/10.1038/emboj.2008.214。

    文章CAS PubMed PubMed Central Google Scholar

  24. 任玲,王勇,石敏,王欣,杨铮,赵忠。CTCF介导Kcnq5位点的细胞型特异性空间组织及局部基因调控。科学通报,2012;7(2):e31416。https://doi.org/10.1371/journal.pone.0031416。

    文章CAS PubMed PubMed Central Google Scholar

  25. Moore JM, Rabaia NA, Smith LE, Fagerlie S, Gurley K, Loukinov D,等。母体CTCF缺失与CTCF无胚的着床期死亡率相关。科学通报,2012;7(4):e34915。https://doi.org/10.1371/journal.pone.0034915。

    文章CAS PubMed PubMed Central Google Scholar

  26. Hirayama T, Tarusawa E, Yoshimura Y, Galjart N, Yagi T. CTCF是神经发育和聚类Pcdh基因随机表达的必要条件。中国生物医学工程学报,2012;2(2):345-57。https://doi.org/10.1016/j.celrep.2012.06.014。

    文章CAS PubMed谷歌学者

  27. Degner SC, Verma-Gaur J, Wong TP, Bossen C, Iverson GM, Torkamani A,等。ccctc结合因子(CTCF)和内聚蛋白影响前b细胞中Igh位点的基因组结构和反义转录。中国科学:自然科学版,2011;38(3):566 - 571。https://doi.org/10.1073/pnas.1019391108。

    文章PubMed PubMed Central Google Scholar

  28. Owens N, Papadopoulou T, Festuccia N, Tachtsidi A, Gonzalez I, Dubois A,等。CTCF在DNA复制后和有丝分裂期间赋予局部核小体弹性。eLife。2019; 8: e47898。https://doi.org/10.7554/eLife.47898。

    文章CAS PubMed PubMed Central Google Scholar

  29. 王晓明,王晓明,王晓明,等。植物细胞中蛋白质的快速降解。地理学报,2009;6(12):917-22。https://doi.org/10.1038/nmeth.1401。

    文章CAS PubMed谷歌学者

  30. 霍兰德AJ,法希内蒂D,韩JS,克利夫兰DW。可诱导的可逆系统,用于快速和完全降解哺乳动物细胞中的蛋白质。中国科学:自然科学版,2012;39(4):357 - 357。https://doi.org/10.1073/pnas.1216880109。

    文章PubMed PubMed Central Google Scholar

  31. Heinz S, Benner C, Spann N, Bertolino E, Lin YC, Laslo P,等。决定谱系的转录因子的简单组合是巨噬细胞和B细胞身份所需的顺式调节元件。生物质化学工程,2010;38(4):576-89。https://doi.org/10.1016/j.molcel.2010.05.004。

    文章CAS PubMed PubMed Central Google Scholar

  32. Kuleshov MV, Jones MR, Rouillard AD, Fernandez NF,段强,王忠,等。一个全面的基因集富集分析web服务器2016年更新。核酸学报,2016;44(1):90 - 7。https://doi.org/10.1093/nar/gkw377。

    文章CAS PubMed PubMed Central Google Scholar

  33. Matys V, Kel-Margoulis O, Fricke E, Liebich I, Land S, Barre-Dirrie A,等。TRANSFAC及其模块trans强迫:真核生物转录基因调控。核酸学报,2006;34(09):D108-10。https://doi.org/10.1093/nar/gkj143。

    文章CAS PubMed谷歌学者

  34. Ernst J, Kheradpour P, Mikkelsen TS, Shoresh N, Ward LD, Epstein CB,等。九种人类细胞中染色质状态动态的制图和分析。大自然。2011;473(7345):43-9。https://doi.org/10.1038/nature09906。

    文章CAS PubMed PubMed Central Google Scholar

  35. 李建军,李建军,李建军,等。ChromHMM:一种自动发现和表征染色质状态的方法。地理学报,2012;9(3):215-6。https://doi.org/10.1038/nmeth.1906。

    文章CAS PubMed PubMed Central Google Scholar

  36. Pugacheva EM, Rivero-Hinojosa S, Espinoza CA, msamudez - catal CF, Kang S, Suzuki T,等。CTCF和BORIS占位的比较分析揭示了两种不同类型的CTCF结合基因组区域。中国生物医学工程学报,2015;16(1):161。https://doi.org/10.1186/s13059 - 015 - 0736 - 8。

    文章CAS PubMed PubMed Central Google Scholar

  37. Knight PA, Ruiz D.矩阵平衡的快速算法。数值分析学报,2013;33(3):1029-47。https://doi.org/10.1093/imanum/drs019。

    文章Google Scholar

  38. 王辉,Maurano MT, Qu H, Varley KE, Gertz J, Pauli F,等。CTCF占用的广泛可塑性与DNA甲基化有关。中国生物医学工程学报,2012;22(9):1680-8。https://doi.org/10.1101/gr.136101.111。

    文章CAS PubMed PubMed Central Google Scholar

  39. 石原,王晓明,王晓明,等。ctcf依赖性染色质绝缘子与表观遗传重塑的关系。生物化学学报,2006;23(5):733-42。https://doi.org/10.1016/j.molcel.2006.08.008。

    文章CAS PubMed谷歌学者

  40. Damaschke NA, Gawdzik J, Avilla M, Yang B, Svaren J, Roopra A,等。CTCF缺失介导人类癌症中独特的DNA超甲基化景观。临床表观遗传学,2020;12(1):80。https://doi.org/10.1186/s13148 - 020 - 00869 - 7。

    文章CAS PubMed PubMed Central Google Scholar

  41. Schuijers J, Manteiga JC, Weintraub AS, Day DS, Zamudio AV, Hnisz D,等。MYC转录失调揭示了共同的增强子对接机制。中国生物医学工程学报,2018;23(2):349-60。https://doi.org/10.1016/j.celrep.2018.03.056。

    文章CAS PubMed PubMed Central Google Scholar

  42. 张建军,李建军,张建军,等。CTCF控制mge衍生的皮质中间神经元的身份和迁移。中华神经科学杂志,2019;39(1):177-92。https://doi.org/10.1523/jneurosci.3496 - 17.2018。

    文章CAS PubMed PubMed Central Google Scholar

  43. Saldaña-Meyer R, González-Buendía E, Guerrero G, Narendra V, Bonasio R, Recillas-Targa F,等。CTCF通过与其天然反义转录物Wrap53的直接相互作用调控人类p53基因。基因发育,2014,28(7):723-34。https://doi.org/10.1101/gad.236869.113。

    文章CAS PubMed PubMed Central Google Scholar

  44. Liberzon A, Subramanian A, Pinchback R, Thorvaldsdóttir H, Tamayo P, Mesirov JP。分子特征数据库(MSigDB) 3.0。生物信息学。2011;27(12):1739 - 40。https://doi.org/10.1093/bioinformatics/btr260。

    文章CAS PubMed PubMed Central Google Scholar

  45. 张宏,张勇,周旭,Wright S, Hyle J,赵磊,等。基于报道者的CRISPR/Cas9筛选对MLLr白血病HOXA9规则组功能的研究eLife。2020; 9: e57858。https://doi.org/10.7554/eLife.57858。

    文章CAS PubMed PubMed Central Google Scholar

  46. 白波,王鑫,李勇,陈鹏程,于坤,Dey KK, Yarbro JM,韩鑫,Lutz BM,饶生,等:深度多层脑蛋白质组学研究阿尔茨海默病进展的分子网络。中国生物医学工程学报,2016,35(5):975-991。

  47. 戴克坤,王辉,牛明,白波,王旭,李勇,等。深度未耗尽的人类血清蛋白质组分析对阿尔茨海默病的生物标志物发现。中国生物医学工程学报,2019;16(1):16。https://doi.org/10.1186/s12014 - 019 - 9237 - 1。

    文章CAS PubMed PubMed Central Google Scholar

  48. 牛敏,赵建辉,Kodali K, Pagala V, High AA,王辉,等。广泛的多肽分离和基于y1离子的干扰检测方法,可通过等压标记和质谱法进行准确定量。化学学报,2017;89(5):2956-63。https://doi.org/10.1021/acs.analchem.6b04415。

    文章CAS PubMed PubMed Central Google Scholar

  49. 王海燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,陈晓燕,杨颖,等:横纹肌肉瘤治疗靶点的基因组学、表观基因组学和蛋白质组学分析。中国生物医学工程杂志,2018,34(4):411-426。

  50. 王辉,戴克坤,陈鹏程,李勇,牛明,曹建华,等。对皮层、脑脊液和血清中超深层蛋白质组的综合分析揭示了阿尔茨海默病的线粒体特征。神经退行性疾病杂志。2020;15(1):43。https://doi.org/10.1186/s13024 - 020 - 00384 - 6。

    文章CAS谷歌学术

  51. 王辉,Diaz AK, Shaw TI,李勇,牛明,赵建辉,等。脑肿瘤的深度多组学分析识别癌症驱动基因下游的信号网络。生态学报,2019;10(1):3718。https://doi.org/10.1038/s41467 - 019 - 11661 - 4。

    文章CAS PubMed PubMed Central Google Scholar

  52. 杜波依斯- chevalier J, ogger F, Dehondt H, Firmin FF, gereraert C, Staels B,等。一个动态的CTCF染色质结合景观促进DNA羟甲基化和转录诱导脂肪细胞分化。核酸学报,2014,42(17):10943-59。https://doi.org/10.1093/nar/gku780。

    文章CAS PubMed PubMed Central Google Scholar

  53. Shukla S, Kavak E, Gregory M, Imashimizu M, Shutinoski B, Kashlev M,等。ctcf促进RNA聚合酶II暂停链接DNA甲基化剪接。大自然。2011;479(7371):74 - 9。https://doi.org/10.1038/nature10442。

    文章CAS PubMed PubMed Central Google Scholar

  54. 王东,张晓霞,王东,程霞。甲基化依赖的CTCF与DNA结合的结构基础。中国生物医学工程学报,2017,36(6):711-720。

  55. Clark SJ, angelaguet R, Kapourani C- a, Stubbs TM, Lee HJ, Alda-Catalinas C,等。Marioni JC,等:scNMT-seq能够联合分析单细胞中染色质可及性DNA甲基化和转录。生态学报,2018;9(1):781。https://doi.org/10.1038/s41467 - 018 - 03149 - 4。

    文章CAS PubMed PubMed Central Google Scholar

  56. Thurman RE, Rynes E, Humbert R, Vierstra J, Maurano MT, Haugen E,等。人类基因组可接近的染色质景观。自然。2012;489(7414):75 - 82。https://doi.org/10.1038/nature11232。

    文章CAS PubMed PubMed Central Google Scholar

  57. 李建军,李建军,李建军,等。甲基化- atac -seq技术在DNA甲基化分析中的应用。基因工程学报,2019;29(6):969-77。https://doi.org/10.1101/gr.245399.118。

    文章CAS PubMed PubMed Central Google Scholar

  58. 曲军,易刚,周宏。p63与CTCF协同调节皮肤角质形成细胞染色质结构。遗传学报,2019;12(1):31。https://doi.org/10.1186/s13072 - 019 - 0280 - y。

    文章PubMed PubMed Central Google Scholar

  59. Pham D, Moseley CE, Gao M, Savic D, Winstead CJ, Sun M, Kee BL, Myers RM, Weaver CT, Hatton RD:利用ets1依赖性募集Ctcf在T细胞中染色质重组的研究进展。Cell Reports 2019, 29:1203-1220.e1207。

  60. Nishana M, Ha C, Rodriguez-Hernaez J, Ranjbaran A, Chio E, Nora EP等。定义CTCF和CTCFL对基因组调控的相对贡献和联合贡献。中国生物医学工程学报。2020;21(1):108。https://doi.org/10.1186/s13059 - 020 - 02024 - 0。

    文章CAS PubMed PubMed Central Google Scholar

  61. 拉heed Mohammed Ata U, Rochman Y,王磊,崔凯,刘超,等:STAT5转录因子四聚化在细胞因子应答和正常免疫功能中的关键作用。免疫力。2012;(4):586 - 99。https://doi.org/10.1016/j.immuni.2012.02.017。

    文章CAS PubMed PubMed Central Google Scholar

  62. Kim M-S, Pinto SM, Getnet D, Nirujogi RS, Manda SS, Chaerkady R,等。人类蛋白质组的草图。自然。2014;509(7502):575 - 81。https://doi.org/10.1038/nature13302。

    文章CAS PubMed PubMed Central Google Scholar

  63. 王欣,李勇,吴忠,王宏,谭宏,彭杰。JUMP:一种基于标签的高灵敏度和准确性肽识别数据库搜索工具。生物工程学报,2014;13(12):3663-73。https://doi.org/10.1074/mcp.O114.039586。

    文章CAS PubMed PubMed Central Google Scholar

  64. 李勇,王旭,赵建华,肖提,吴志,白波,等。JUMPg:一个整合的蛋白质基因组学管道,识别人类大脑和癌细胞中的未注释蛋白质。蛋白质学报,2016;15(7):2309-20。https://doi.org/10.1021/acs.jproteome.6b00344。

    文章CAS PubMed PubMed Central Google Scholar

  65. 谭辉,吴忠,王辉,白波,李勇,王旭,等。磷酸添加剂富集精制磷酸肽及人脑磷蛋白组分析。蛋白质组学,2015;15(3):500 - 7。https://doi.org/10.1002/pmic.201400171。

    文章CAS PubMed谷歌学者

  66. 王辉,杨毅,李毅,白波,王旭,谭宏,等。用于脑蛋白质组深度分析的长梯度色谱质谱系统优化。蛋白质学报,2015;14(2):829 - 838。https://doi.org/10.1021/pr500882h。

    文章CAS PubMed谷歌学者

  67. 张斌,王军,王旭,朱军,刘强,史忠,等。人类结肠癌和直肠癌的蛋白质基因组学特征。大自然。2014;513(7518):382 - 7。https://doi.org/10.1038/nature13438。

    文章CAS PubMed PubMed Central Google Scholar

  68. 李勇,梁文文,李文华,李文华,李文华,李文华,李文华,等:肺腺癌蛋白基因组学研究进展。中国生物医学工程学报,2016,32(2):556 - 556。

  69. 张天成,Carter RA,李毅,李毅,王宏,Edmonson MN,等。儿童癌症的新表位景观。中华医学杂志,2017;9(1):78。https://doi.org/10.1186/s13073 - 017 - 0468 - 3。

    文章CAS PubMed PubMed Central Google Scholar

  70. 张辉,Emerson DJ, Gilgenast TG, Titus KR,蓝燕,黄鹏,等。有丝分裂至g1期的染色质结构动力学。自然。2019;576(7785):158 - 62。https://doi.org/10.1038/s41586 - 019 - 1778 - y。

    文章CAS PubMed PubMed Central Google Scholar

  71. Schmittgen TD, Livak KJ。采用比较C(T)法分析实时PCR数据。自然科学学报,2008;3(6):1101-8。https://doi.org/10.1038/nprot.2008.73。

    文章CAS PubMed谷歌学者

  72. 张海燕,张海燕,王志强,王志强。天然染色质的转位对开放染色质,dna结合蛋白和核小体位置的快速和敏感的表观基因组分析。地理学报,2013;10(12):1213-8。https://doi.org/10.1038/nmeth.2688。

    文章CAS PubMed PubMed Central Google Scholar

  73. 李宏,Durbin R:基于Burrows-Wheeler变换的快速准确短读对齐。生物信息学(牛津,英国)2009,25:1754-1760。

  74. 李H, Handsaker B, Wysoker,芬内尔T,阮J,荷马N,马斯G, Abecasis G,杜宾R,基因组工程数据处理:序列比对/地图格式和SAMtools。生物信息学(牛津,英国)2009,25:2078-2079。

  75. 张勇,刘涛,Meyer CA, Eeckhoute J, Johnson DS, Bernstein BE,等。ChIP-Seq (MACS)的模型分析。中国生物医学工程学报,2008;9(9):391 - 391。https://doi.org/10.1186/gb - 2008 - 9 - 9 - r137。

    文章CAS PubMed PubMed Central Google Scholar

  76. 昆兰AR,霍尔IM: BEDTools:一套灵活的工具,用于比较基因组特征。生物信息学报,2010,26:841-842。

  77. 罗文武,陈勇,史伟。Smyth GK。voom:精确权重解锁RNA-seq读取计数的线性模型分析工具。中国生物医学工程学报,2014;15(2):R29。https://doi.org/10.1186/gb - 2014 - 15 - 2 - r29。

    文章CAS PubMed PubMed Central Google Scholar

  78. 贝利TL, Boden M, Buske FA, Frith M, Grant CE, Clementi L,等。模因套件:模因发现和搜索工具。核酸学报,2009;37(Web Server): W202-8。https://doi.org/10.1093/nar/gkp335。

    文章CAS PubMed PubMed Central Google Scholar

  79. Ramírez F, Ryan DP, gr ning B, Bhardwaj V, Kilpert F, Richter AS,等。deepTools2:用于深度测序数据分析的下一代web服务器。核酸学报,2016;44(1):160 - 5。https://doi.org/10.1093/nar/gkw257。

    文章CAS PubMed PubMed Central Google Scholar

  80. 奚毅,李伟。BSMAP:亚硫酸氢盐全基因组序列定位程序。生物医学信息学报,2009;10(1):232。https://doi.org/10.1186/1471 - 2105 - 10 - 232。

    文章CAS PubMed PubMed Central Google Scholar

  81. 吴辉,徐涛,冯辉,陈磊,李波,姚波,等。亚硫酸氢盐全基因组测序数据中差异甲基化区域的检测中国生物医学工程学报,2015;43(4):391 - 391。

    PubMed  PubMed Central  Google Scholar 

  82. 彭杰,Elias JE, Thoreen CC, Licklider LJ, Gygi SP.多层色谱-串联质谱(LC/LC - MS/MS)在酵母蛋白质组分析中的应用。中国生物医学工程学报,2003;2(1):1 - 4。https://doi.org/10.1021/pr025556v。

    文章CAS PubMed谷歌学者

  83. 徐波,张勇,邵勇,范勇,卢荣,李超。CTCF的急性缺失对全基因组染色质可及性的影响。GSE153237。基因表达综合。2021。https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc = GSE153237。2020年6月25日发布。

  84. Hyle J,张颖,Wright S, Li c。CTCF的急性缺失通过增强子-启动子环的缺失直接影响MYC的调控。GSE120781。基因表达总汇。2019。https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc = GSE120781。2019年5月4日查阅。

  85. 张颖,Hyle J, Wright S, Li c。CTCF的急性缺失通过增强子-启动子环的缺失直接影响MYC调控。GSE126619。基因表达总汇。2019。https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc = GSE126619。2019年5月4日查阅。

  86. Hyle J,张颖,Wright S, Li c。CTCF的急性缺失通过增强子-启动子环的缺失直接影响MYC的调控。GSE138862。基因表达总汇。2019。https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc = GSE138862。2019年10月16日访问。

  87. 王慧,牛明,彭军,李晨。CTCF的急性缺失改变了全基因组染色质可及性。PXD026484。ProteomeXchange蛋白质组学鉴定(PRIDE)数据库。2021.http://www.ebi.ac.uk/pride/archive/projects/PXD026484。2021年4月7日访问。

下载参考

致谢。

我们非常感谢St. Jude儿童研究医院综合癌症中心的Hartwell测序设施工作人员。我们感谢李实验室成员的批评意见和讨论。我们还要感谢Nisha Baders博士对我们手稿的科学编辑的帮助。

回顾历史

评审历史记录作为附加文件9提供。

同行评议信息

蒂姆·桑兹(Tim Sands)是这篇文章的主要编辑,并与其他编辑团队合作,管理其编辑过程和同行评议。

资金

这项工作的部分资金来自圣裘德综合癌症中心发展基金NCI-5P30CA021765-37,来自国家癌症研究所(C.L.), R01AG053987 (J.P.),美国黎巴嫩叙利亚联合慈善机构(C.L),美国血液学学会学者奖(R.L.)和关注基金会(R.L.)。内容完全是作者的责任,并不一定代表美国国立卫生研究院的官方观点。

作者信息

作者及单位

作者

贡献

概念化:B.X.和C.L.;方法:B.X布什,白雪,J.H, Y.Z,廖曜生,Y.F,一般,R.L.中一段;调查:B.X布什,白雪,J.H, Y.Z,廖曜生,Y.F。R.L。中一段;软件与形式分析:B.X、h.w.、W.R、N.M.D、y.z;写作、评审、编辑:B.X、h.w.、C.L.;监督和资金获取:C.L.作者阅读并批准最终稿件。

相应的作者

与徐北思或李春良的通信。

道德声明

伦理批准并同意参与

不适用

发表同意书

不适用

相互竞争的利益

作者声明没有利益冲突。

额外的信息

出版商的注意

施普林格·自然对已出版的地图和机构关系中的管辖权要求保持中立。

补充信息

附加文件1:补充图-图S1-S13。

附加文件2:补充表-表S1。

ATAC-seq峰值数据。

附加文件3:补充表-表S2。

ATAC-seq统计和QC。

附加文件4:补充表-表S3。

DMR概要文件。

附加文件5:补充表-表S4。

绝缘子目标。

附加文件6:补充表-表5。

MAGeCK分析CRISPR屏幕。

附加文件7:补充表-表S6。

全蛋白质组和磷蛋白质组数据的差异表达分析。

附加文件8:补充表-表S7。

RNA-seq数据总结。

附加文件9。

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议,该协议允许以任何媒介或格式使用、共享、改编、分发和复制,只要您适当地注明原作者和来源,提供知识共享许可协议的链接,并注明是否进行了更改。本文中的图像或其他第三方材料包含在文章的知识共享许可协议中,除非在材料的署名中另有说明。如果材料未包含在文章的知识共享许可中,并且您的预期用途不被法律法规允许或超过允许的用途,您将需要直接获得版权所有者的许可。要查看本许可的副本,请访问http://creativecommons.org/licenses/by/4.0/。知识共享公共领域免责条款(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非在数据的署名中另有说明。

转载和许可

关于本文

Check for updates. Verify currency and authenticity via CrossMark

引用本文

徐斌,王浩,Wright, S.等。CTCF的急性耗竭改变了全基因组染色质的可及性。生物工程学报22,244(2021)。https://doi.org/10.1186/s13059-021-02466-0

下载引用

  • 收稿日期:2020年10月05日

  • 录用日期:2021年8月12日

  • 发布日期:2021年8月24日

  • DOI: https://doi.org/10.1186/s13059 - 021 - 02466 - 0

关键字