基因组的遗传信息得以表达,首先需要 RNA polymerase (RNAP) 以 DNA 为模板合成 RNA。基因转录不仅是基因表达第一步,还是基因表达的主要调控步骤。对 RNAP 分子机器结构、运行机理以及调控机制的研究能够回答基因表达调控的基础生物学问题。在转录起始阶段,细菌的 RNAP 与转录起始σ因子形成复合物,依次执行启动子双链 DNA 的识别、解链以及 RNA 起始合成等关键步骤。细菌 RNAP 通过与多个σ因子结合特异性调控基因转录,其中 Extra-Cytoplasmic Function(ECF)σ因子是细菌中种类最多的一类σ因子,它可以感受细菌胞内外环境变化,起始特异性的基因转录。ECF σ因子赋予细菌适应逆境的能力,对于致病菌的致病性和耐药性尤为重要。以结核分枝杆菌(Mycobacterium tuberculosis)为例,其 RNAP 分别与 10 种 ECF σ因子结合,通过识别特异启动子序列启动相应基因表达,多个 ECF σ因子与结核分枝杆菌的致病、侵染以及耐药直接相关。
3 月 11 日,国际学术期刊《自然 - 通讯》(Nature communications)在线发表了中国科学院分子植物科学卓越创新中心 / 植物生理生态研究所 / 中科院合成生物学重点实验室张余研究组题为 Structure basis for transcription initiation by bacterial ECF σ factors 的研究论文。该论文解析了两个结核分枝杆菌 RNA 聚合酶与σH 的高分辨率转录起始复合物晶体结构。这两个首次解析的细菌 RNAP 与 ECF σ因子的复合物结构回答了以下几个关键问题:1)ECF σ因子与 RNAP 组装成全酶的方式与 housekeeping σ因子类似,特别是 ECF σ因子连接σ2 和σ4 结构域的 linker 区域,虽然其序列上与 housekeeping σ因子没有任何的相似性,但是该 linker 区域与 RNAP 结合方式与 housekeeping σ因子的σ3.2 结构域类似,均结合到 RNA 聚合酶的活性中心,在转录起始过程中起着至关重要的作用;2)ECF σ因子采用独特的机制打开启动子双链 DNA 形成转录泡;3)ECF σ因子采用独特的方式结合单链的启动子 DNA -10 区的保守序列,通过对比 RNAP-σH 全酶以及 RNAP-σH-DNA 的两个复合物结构,张余课题组发现 ECF σ因子采用 Induced-Fit 方式结合解链的启动子 DNA,而 housekeeping σ因子识别启动子采用 Lock-and-Key 的模式。两种模式的区别在于 Induced-Fit 的方式只能结合正确的启动子 DNA 序列,因为只有正确的启动子 DNA 序列才能够诱导 DNA 的结合口袋打开,该方式保证了 ECF σ因子转录起始的专一性;而 Lock-and-Key 的方式能够容忍一定的启动子 DNA 序列差异,从而保证了 housekeeping σ因子的转录起始的高效性和广泛性。该研究揭示了细菌 ECF σ因子转录起始的结构基础以及分子机制,为基于 ECF σ因子的合成生物学正交转录元件设计提供了理论基础,为靶向细菌 RNAP 的抗生素发现提供了新的思路。
张余研究组博士李玲婷和方城力是这篇论文的共同第一作者。该研究得到国家自然科学基金(31670067 和 3182201)、中科院先导专项(XDB29020000)、中科院重点部署项目(QYZDB-SSW-SMC005)的资助。