转录组测序技术在药用植物研究中的应用

  • A+

  要:转录组测序技术是一种新发展的转录组学研究方法。在物种基因组信息未知的情况下,进行测序得到遗传信息,转录组测序技术是很重要的分子生物学方法,已经被广泛应用于各个研究领域。而药用植物遗传信息匮乏,对药用植物的转录组进行测序在基因组学是比较活跃的领域,可以了解植物的基因表达并分析其功能和调控机制。对药用植物的转录组学研究有助于解决遗传育种、筛选优良抗性基因等问题。介绍了转录组测序的发展,并从功能基因挖掘和次生代谢产物途径探索等方面综述了近年来转录组测序在药用植物研究中的应用,为药用植物的研究提供了更多基础数据。




转录组测序(transcriptome sequencing)是对某一物种的mRNA进行高通量测序,而转录组测序的结果反映了特定条件和特定时间点的基因表达情况。随着时间或外部的环境变化,转录组也会随之变化,除了转录衰减和mRNA降解现象,转录组包括了细胞内所有能转录出的mRNA,而转录组测序的结果反映了特定条件和特定时间点的基因表达情况[1]。在参考基因组序列存在的情况下,转录组测序可以实现序列的变异鉴定[2-4]、空间和时间表达谱测定[5-6]、基因模型结构的验证和鉴定[7-8]。在没有参考基因组的情况下,转录组测序也可以挖掘基因[9-12],进行对比分析[13],计算其表达丰度[14-15]

转录组研究的方法比较多,如基因表达序列分析(serrial analysis of gene expression)、表达序列标签(expressedsequence tagEST基因芯片、高通量测序等[16-17]。而现阶段转录组学研究主要依靠高通量测序技术。但是,对于非模式生物来说,大多数植物的基因组信息较为匮乏,而高通量测序的优势在于无需参考基因组,在没有获得物种的基因组信息的情况下仍可以进行转录组测序。另外,高通量测序获得的数据可以覆盖全部转录本,这对于挖掘功能基因是十分有利的。


1  转录组测序技术

1.1  1代测序技术

沃森和克里克在1953年发现了双螺旋结构[18],了解核酸的空间结构后,人们开始研究对应的序列信息,测序技术也开始发展。1964年,Holley完成了对酵母丙氨酸转移tRNA的测序[19],自此核酸测序才正式出现。随后测序技术迅速发展。1977年,生物化学家Sanger发明了链终止测序法,一种基于T4 DNA聚合酶和大肠杆菌DNA聚合酶的快速DNA测序方法[20-21]。同年,Gilbert发明了化学降解测序法[22]。这2种测序技术被认为是第1代测序技术。而后Sanger测序法渐渐占据了主要地位,现在普遍认为第1代测序技术为Sanger测序法。

1.2  2代测序技术

人类基因组的测序工作结束后,人们想通过测序的方法来获得其他物种的基因信息[23-24]。而传统的Sanger测序法比较费时费力、低通量且成本很高,不能满足日益增长的测序需求。很快人们开发出了第2代测序技术(next-generationsequencingNGS)。第2代测序技术成本低、速度快,而且覆盖度较深,可以同时对数百万个DNA进行测序,核酸测序技术进入自动化时代[25-27],渐渐取代了Sanger测序法。高通量测序目前可在5个主要商业平台上获得:Roche454)、ABI-SOLi DIllumina基因组分析仪、Ab I3730xl基因组分析仪以及Heli Scope。现今应用较多的为前3者。

1.3  3代测序技术

随着时间的推移,第2代测序技术的各种问题渐渐凸显,随后诞生了第3代测序技术,比较有代表性的测序技术:纳米孔单分子测序技术(Oxford Nanopopre Technologies公司)和单分子实时测序(single-molecular real-timeSMRTPacBio公司)。第3代测序技术使用的是单分子测序技术,通量高和测序读数长。近年来应用较为广泛的是PacBio RSII测序平台,无需进行PCR扩增即可完成测序。平均读长可以达到1015 kb,而最大读长可达64.5 kb[28]。而第3代测序的准确率明显比前2代低,PacBio公司的SMRT测序技术准确率只能达到85%左右[29]。这样一来,为了控制错误率无形中增加了测序的技术难度和成本[30]


2  转录组测序技术在药用植物中的应用

药用植物合成了无数的次级代谢产物,而这些次生代谢产物是研发新药的重要来源,如青蒿素(artemisinin)、人参皂苷(ginsenoside)、紫杉醇(taxol)等,但是它们的含量并不是很高。所以造成了药用植物的无序开发,资源日益减少。通过克隆关键酶基因及代谢工程生产药用植物药效成分已经成为药物生产和新药开发的主要研究方法[33]

相比已经完成基因组测序的模式生物,药用植物缺少基因组数据,遗传背景不清晰,发展缓慢。药用植物高通量转录组测序技术的出现,可以挖掘药用植物有效成分生物合成的功能基因并分析其表达规律,探索有效成分的生物合成途径及其调控机制,从而提高药用植物有效成分的含量。药用植物高通量测序为挖掘功能基因、探索药用植物有效成分的生物合成途径与调控机制、探索药材道地性分子机制、阐明基因功能提供了新工具。通过测序得到的信息,还可以挖掘参与植物生长发育、抗病抗逆等优良性状的基因。对于药用植物的保护具有极其重大的意义[33-37]

2.1  探索次生代谢产物生物合成途径及功能基因
研究药用植物的初生代谢产物或次生代谢产物的生物合成途径,就需要鉴定途径中的相关酶和基因;在有些途径的分节点往往存在对整条途径起重要的关键酶(限速酶)。因此,阐明药用植物初生代谢产物或次生代谢产物的生物合成途径,挖掘相关基因是非常必要的[38]
博落回Macleayacordata (Willd.) R. Br.是罂粟属的一种传统中药,富含血根碱和白屈菜红碱,二者具有抗菌及促进生长等作用,对博落回进行转录组测序[39],从测序结果中鉴定了16个参与血根碱和白屈菜红碱合成的候选基因,并对14个基因进行了体外功能验证。白及Bletilla striata (Thunb.) Reichb.f. 含有多糖、联苄、二氢菲、甾体、三萜和挥发油等多种有效成分,白及胶质的主要成分为白及多糖,主要由葡萄糖和甘露聚糖组成。对白及全株进行转录组测序[40],得到了243410Unigenes参与了半乳糖、果糖、糖胺多糖和甘露糖等多种糖类代谢,筛选到己糖激酶(62Unigenes)、甘露糖变位酶(1Unigene)、果糖激酶(61Unigenes)、果糖-1,6-二磷酸酶(1Unigenes)、二磷酸果糖激酶(9Unigenes)、6-磷酸果糖激酶(12Unigenes)基因。对芦荟 Aloe vera (Linn.) N.L. Burman var. chinensis (Haw.) Berg. 根和叶进行转录组测序[41],分别得到113 063141310Unigenes,筛选到16个与皂苷、木质素、蒽醌和类胡萝卜素等次生代谢产物生物合成有关的基因。对毛鸡骨草Abrus mollis Hance的转录组测序[42]得到53 743Unigenes,其中7 572Unigenes注释到128条不同的KEGG途径。注释到苯丙氨酸、酪氨酸和色氨酸生物合成途径中的有72Unigenes,在苯丙烷类生物合成途径中注释到的Unigenes204个,黄酮类生物合成途径中注释了23Unigenes22Unigenes注释到了异黄酮生物合成途径。倍半萜类化合物是洋甘菊Matricaria chamomilla L. 中主要的活性物质,对洋甘菊的花、茎、根和叶子进行测序[43],获得83741Unigenes,其中参与倍半萜类化合物合成Uinigenes61个。黄精Polygonatumsibiricum Delar. exRedoute中的黄精多糖具有提高免疫力的功能,在黄精的转录组测序中[44],筛选到138Unigenes,编码20种与黄精多糖生物合成相关的酶。对大戟Euphorbia pekinensis Rupr. 的根、茎、叶进行转录组测序[45],得到了157491Unigenes,其中选取26Unigenes作为二萜合酶候选基因,通过qRT-PCR进一步分析,选择了10个参与二萜生物合成基因进行了验证。Liu[46]对长春花Catharanthusroseus (Linn.) G. Don进行转录组测序,在测序数据中筛选出了1个属于WRKY家族的转录因子,对其进行克隆和功能验证,进一步确定该基因在萜类吲哚生物碱(TIAs)生物合成中的功能,并阐明了长春花萜类吲哚生物碱生物合成通路中转录因子的调控网络。
冬凌草中的冬凌草甲素属于贝壳杉烷型四环二萜类化合物,可以减缓肿瘤生长。对冬凌草进行转录组测序[47],共得到44 626Unigenes,选择与萜类骨架和二萜类生物合成相关的候选基因1-脱氧D-木酮糖-5-磷酸还原异构酶(DXR)、1-脱氧-D-木酮糖-5-磷酸合酶(DXS)、内根-贝壳杉烯合成酶(KS)、贝壳杉烯氧化酶(KO),通过qRT-PCR分析这些候选基因在根、叶和茎中的表达模式。半夏Pinelliaternata (Thunb.) Berit. 中主要的生物活性成分为生物碱,如生物合成由L-苯丙氨酸开始的麻黄碱。半夏经测序后得到89 068Unigenes[48],在测序数据中鉴定了6个注释为苯丙氨酸氨裂解酶(PAL)的Unigenes52个参与麻黄碱和苯甲酸生物合成的Unigenes。齐墩果烷型三萜皂苷是桔梗的主要化学成分,桔梗皂苷D是主要的生物活性成分,经过转录组测序[49],获得34 053Unigenes,筛选到了19个参与三萜皂苷生物合成途径的候基因。
2.2 SSR分子标记开发
分子标记可以反映物种在基因水平上的遗传多样性。简单重复序列(simple sequence repeatSSR)技术广泛应用于基因定位、辅助育种[50]、遗传图谱、分子标记筛选、品种纯度鉴定[51]等方面的研究,是目前应用最广泛的DNA分子标记技术之一[52]SSR可分为2类:基因组SSR和表达序列标签(EST-SSR)。以随机基因组序列为背景开发基因组SSR较为困难[53-54]。但是在转录的RNA序列中鉴定EST-SSR比非编码序列更加容易。开发大量有价值的EST序列对于基因的注释、发现[55-56]、分子标记的发展[57-58]尤其重要。
对心籽绞股蓝Gynostemma cardiospermum Cogn. ex Oliv.和绞股蓝Gynostemma pentaphyllum (Thunb.) Makino进行转录组测序[51],得到71607Unigenes,开发并验证了大量EST-SSR标记,筛选到3 891SSR序列,设计了2 596对引物,随机选择其中360对引物进行验证,最终得到15SSR标记可被用于评估该物种的遗传多样性。在七叶一枝花Paris polyphylla Smith. 转录组测序数据[59]中鉴定了3 853EST-SSR分子标记,随机设计引物,其中39对引物扩增性良好,开发了9SSR标记,测试了11个种质的55个七叶一枝花样品的基因型。
丛琨[60]对味连Coptis chinensis Franch. 和云连C. teeta Wall. 的叶片和根进行转录组测序,将大量转录组数据与公共数据库序列进行比对、功能注释。筛选出大量与异喹啉生物碱生物合成相关的基因和功能性SSR。张金渝等[61]利用转录组测序技术开发SSR,利用SSR标记对6个文山三七Panaxnotoginseng (Burk.)F. H. Chen居群的遗传多样性及其遗传结构进行分析,发现三七具有丰富的遗传多样性。黄海燕等[62]建立了适合杜仲Eucommia ulmoides OliverSSR-PCR反应体系,共筛选出13对具有多态性的引物,为杜仲的遗传多样性、群体遗传学、亲缘关系等研究奠定了基础。邓科君等[63]开发了83SSR引物,对13个不同居群的丹参Salvia miltiorrhiza Bunge样品以及10种鼠尾草属物种进行了扩增、多态性及通用性检测。郭林林[64]对丹参品系ZH23进行简化基因组测序,利用得到的序列信息查找开发SSR,发现可以用于设计引物的SSR6 058个,并设计出6 058对特异性的SSR引物,选取665SSR引物进行筛选,有568对引物产生了清晰的条带,共有356SSR引物在亲本间具有多态性。杨雯等[65]对虎耳草属植物混合样本进行基因组测序,利用MISA程序识别和定位SSR位点,随机合成120对引物进行多态性引物筛选,再从多态性引物中选取易扩增、多态性高的引物,共扩增出2 687个多态性条带,每对引物平均扩增出了158个多态性条带。

2.3 次生代谢产物生物合成途径挖掘

三萜皂苷是远志Polygala tenuifolia Willd.重要的药用成分之一。对不同年份的远志进行转录组测序[66],有176Unigenes参与萜类化合物骨架生物合成,参与其他次级代谢产物的生物合成的Unigenes522个。杠柳Periplocasepium Bunge中主要的生物活性物质C21类固醇和杠柳毒苷均来自类固醇合成途径,对杠柳叶、根、不定根及愈伤组织进行转录组测序[67],筛选到24个参与类固醇生物合成途径的基因。贯叶金丝桃Hypericum perforatum L. 中的金丝桃素和褪黑激素是其主要的活性成分,具有抗抑郁、抗炎、抗病毒、抗癌和抗菌作用,测序结果[12]显示,2359Unigenes与次生代谢产物通路有关,与金丝桃素和褪黑激素合成有关的Unigenes260个。对虎杖Polygonum cuspidatum Sieb. et Zucc. 根部进行转录组测序[68],获得86 418Unigenes,总共有22 572Unigenes注释到了119KEGG通路。分别有12186054Unigenes分别注释到甲羟戊酸(MVA)、甲基- D-赤藓糖醇-4-磷酸(MEP)、莽草酸和白藜芦醇生物合成途径。

转录组测序技术应用于药用植物的研究情况见表2

3 结语

本文综述了转录组测序技术在药用植物中的研究进展,转录组测序技术是一种转录组学的研究方法,遗传信息可以通过测序获得,在物种基因组信息未知的情况下,通过测序可得到遗传信息。由于药用植物遗传信息的匮乏,转录组测序技术逐渐应用于药用植物转录组的研究中。为了保护重要的药用植物及濒危药用植物的多样性及其可持续利用,在转录组水平上进行测序是非常必要的。

本文从功能基因挖掘、SSR分子标记开发和次生代谢产物生物合成途径探索3个方面阐述了转录组测序技术在药用植物中的应用。除了以上应用以外,转录组学的应用推进了药用植物中天然产物发现。植物可合成无数次级代谢产物,而这些次生代谢产物可以作为药物开发的新来源,研究药用植物有效成分的生物合成及其遗传机制有助于大规模生产这些有效成分。转录组测序技术还可以应用于某些有毒中药的减毒研究,它的出现有助于选育品质产量皆优的药用植物,阐明药用植物遗传信息及调控网络,探索中药防病治病的分子机制。转录组测序技术在药用植物研究领域必将拥有广阔的应用前景。

参考文献(略) 

来  源:慧  芳,刘秀岩,李宗谕,刘福顺,杨世海. 转录组测序技术在药用植物研究中的应用 [J]. 中草药, 2019, 50(24):6149-6155.



weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0