Nat Chem Biol | CRISPR-Cas9助力揭示模块化多酶复合体小分子生物合成新机理

  • A+
on style="white-space: normal; margin-left: 8px; margin-right: 8px;">责编 | 兮


非核糖体肽合成酶(Nonribosomal Peptide Synthetase, NRPS) 和聚酮合酶(Polyketide Synthase, PKS) 普遍存在于细菌和真菌当中产生小分子天然化合物。这些天然产物往往具有抗感染、抗真菌、抗肿瘤、免疫抑制等活性(比如抗生素红霉素erythromycin和达托霉素daptomycin),因此被广泛应用于小分子药物开发当中。深入研究NRPS和PKS工作机理可以加深我们对此类天然产物合成的理解,为进一步开发和改造合成新型天然活性小分子提供理论支撑。

2019年10月21日,加州大学圣地亚哥分校克里斯普尔斯海洋研究所(Scripps Institution of Oceanography, University of California at San Diego)的Bradley S. Moore团队在Nature Chemical Biology上在线发表了题为“Pass-back chain extension expands multimodular assembly line biosynthesis”的研究论文,该研究揭示了NRPS-PKS多酶复合体中多种生物合成的新机理。通讯作者Bradley S. Moore教授就职于Scripps海洋研究所,其团队致力于海洋来源细菌以及海藻来源的天然产物的开发,生物合成机理解析,以及利用基因和化学方法合成和改造天然产物(http://scrippsscholars.ucsd.edu/bsmoore/pages/moore-lab-research )


组成NRPS和PKS多酶复合体最基本的模块包括酰基转移酶结构域(acyltransferase domain, AT)或者腺苷酰化结构域(adenylation, A domain), 巯基化结构域(thiolation domain, T), 酮脂酰合酶(ketosynthase, KS)结构域或者缩合结构域(condensation, C),硫脂酶(thioesterase, TE)。除此之外,其他的一些修饰性的反应结构也常常存在于多酶复合体当中,包括酮还原酶(ketoreductase, KR), 脱水酶(dehydratase, DH), 烯酰还原酶(enoylreductase, ER)和甲基转移酶(methyltransferase, MT)。以往大多的研究表明,组成多酶复合体的结构域一般是呈线性排列,其中共价结合的几个结构域组成的多功能蛋白模块(module)。一般来说,在生物合成反应中每个结构域在化合物链的延伸过程中只参与一次反应。然而越来越多的研究发现这类多酶复合体有时并不遵循“流水线”式的线性反应规律。比如在trans-AT聚酮合酶中,模块当中缺少线性排列的AT结构域。因此,该类多酶复合体会借助异位的AT结构域催化化合物链的延伸。除此之外,研究者也发现一些NRPS模块中缺少A结构域,因而推测这些模块可以借用其他NRPS模块中的A结构域催化多肽链的延伸反应。

在早期的研究中,作者的团队通过与香港科技大学钱培元教授和Scripps海洋研究所William Fenical教授等团队合作,从多株不同海洋来源的细菌中分离鉴定了一类广泛存在的具有免疫抑制活性的环状脂肽化合 ,并命名为thalassospiramides。通过DNA测序分析和前期的生物合成分析研究证明,该类天然化合是由一组NRPS-PKS杂合多酶复合体编码的基因簇合成而来。这类基因簇不但不遵守线性合成规律,而且其中很多PKS模块中还缺少AT结构域。在这项研究中,作者选择了两个最有代表的thalassospiramide基因簇进行研究,其中一个是编码基因最复杂的基因簇ttc,另外一个则是编码合成这类化合物中最简单的基因簇ttm (下图,原文中Fig.1)


为了研究这两个基因簇,作者首先建立了一个已细菌人工染色体为基础的表达载体(pCAP-BAC, Addgene #120229)并用于ttc和ttm基因簇的克隆和异源表达。作者首先尝试利用大肠杆菌为宿主进行基因簇的异源表达,然而在各种分子改造和优化以后都未检测到化合物的表达。随后,作者利用Pseudomonas putida EM383为表达宿主,并引入IntB13 site-specific 整合酶进行基因簇的整合表达。利用这一新建立的表达体系,作者成功地表达了两株选取的基因簇,并利用LC-MS检测到40多个从野生菌中分离到的化合物 (上图和原文中附图5)


尽管ttc和ttm在结构和长度上差别很大,这两种基因簇都可以合成A1-like化合物。其中ttc基因簇又可以产生B-like化合物,ttm可以合成一类结构上相对比较简单的E-like化合物 (下图,原文中Fig. 2)。为了进一步研究ttc和ttm的生物合成功能,作者首先利用基因敲除和异位表达实验,验证了(1)ttc的边界是从ttcA开始到ttcD结束;(2)ttc当中编码的PPTase可以用于激活ttc和ttm编码的结构域,但并不是异源表达所必须的。作者因此推测宿主Pseudomonas putida EM383当中内源的PPTase可以被用于激活这两个异源基因簇。通过结构比较,作者推测模块6中MT6的特异性较差,可以同时负责A-like化合物环形肽结构中络氨酸和缬氨酸的转甲基化的反应。通过敲除互补和点突变实验,作者发现当在MT6 引入导致失活的点突变以后,ttc和ttm只能产生去甲基化的化合物。由于模块5激活的缬氨酸可以被MT6甲基化,而上游绿色区域的缬氨酸并未检测到被甲基化,作者从而推测绿色区域的缬氨酸是由模块2中的A结构域引入。


为了进一步研究其他的催化模块和结构域功能,作者一开始尝试使用相同的敲除互补实验在异位上向补位的蛋白模块引入点突变。但是由于剩余的蛋白模块长度均过大,这使得互补和点突变实验的进行非常困难。多酶复合体维持既有活性需要保持其正确的三维立体结构,如果直接对结构域进行敲除往往会直接导致整个蛋白模块失活。因此在结构域的活性位点中引入点突变失活的方法不但可以精确失活目标结构域,而且可以确保整个蛋白模块依然保持正确的的三位结构,从而确保其他结构域或者蛋白模块保有正常活性。然而大部分编码NRPS和PKS多酶复合体的基因都长度太大,很多情况无法精确的引入需要的点突变。为克服这一研究难题,作者建立一个基于CRISPR-Cas9基因编辑技术和lamda-red重组表达的编辑平台,利用转入的单链DNA在大肠杆菌中精确编辑携带基因簇的质粒载体,从而引入点突变,最终突变的基因簇可以在异源宿主当中表达并检测。

利用这新建立的技术平台,作者成功地在编码多酶复合体的基因上引入点突变,再利用高精度LC-MS对突变蛋白所产的天然产物进行分析。作者发现编码Thalassospiramide的多酶复合体具有很多前所未有的生物合成特点。

第一、 不同模块之间互相借用功能催化结构域 (intermodule substrate activation and tailoring)。比如A1激活的苯丙氨酸或络氨酸和A3激活的丝氨酸都可以直接被模块1上的T1a结构域使用,成为化合物链的合成提供初始氨基酸。

第二、 选择性跳过不同合成模块(module skipping)。比如在ttc中,在A-like类的化合物合成过程中,模块1b被选择性的跳过。与其相反,在B-like类的化合物的合成中,则需要使用模块1b加入一个C2聚酮单元。另外在Ttm合成E-like类化合物过程中,模块2倍被忽略使用(下图,原文中Fig.4)


第三重复使用已经使用过的模块(pass-back chain extension)。比如所有拥有绿色化合物链的化合物都重复使用了1-2次模块2和模块4 (原文中Fig2)。在作者提出的合成模型中,当链中间体首次到达模块4的时候,模块4更倾向于将较短的中间产物传递回模块2中加成一个缬氨酸,安然后再次进行模块4的延伸。当模块4检测到中间产物已经达到一定长度,模块4将把中间产物传递到模块5加入一个缬氨酸,然后利用随后的模块合成最终的化合物 (下图,原文中Fig.5)


该研究首次实验证实了多种的NRPS-PKS多酶复合体生物合成中存在的新机制,这些新发现拓宽了我们对NRPS-PKS这类最广泛存在天然产物合成机器的认知。文中首次建立了一个精确编辑大分子NRPS-PKS多酶复合体的方法,这一方法可以被广泛的应用于大分子多酶复合体基因簇的精确DNA编辑,并且进一步用于对以此类复合体的工程改造当中。


原文链接:
https://doi.org/10.1038/s41589-019-0385-4



weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0