|
本草基因组学(herbgenomics)是从基因组水平研究中药及其对人体作用的一门前沿学科,利用组学技术研究中药基原物种的遗传信息及其调控网络,阐明中药防治人类疾病的分子机制。研究match内容涉及结构基因组、转录组、功能基因组、蛋白质组、代谢组、表观基因组、宏基因组、药用模式生物、基因组辅助分子育种、中药合成生物学、DNA鉴定、中药体内代谢基因组研究和生物信息学及数据库等多个方面。
本草基因组学将会大力推动前沿生命科学技术在药用植物和中药领域的应用,实现药用植物和中药学研究的跨越式发展,助其迅速走到生命科学研究的最前沿。
本草基因组学的产生和发展
1. 本草基因组学的产生
从“神农尝百草,一日而遇七十毒”的传说到现存最早的中药学著作《神农本草经》(又称为《本草经》),从世界上现存最早的国家药典《新修本草》(《唐本草》)到本草学巨著《本草纲目》,两千多年来本草学的发展反映中国人民在寻找天然药物、利用天然药物方面积累了丰富经验。中药学是中国医药学的伟大宝库,对世界医药学发展做出了巨大贡献。随着现代科学技术的发展,特别是人类基因组计划(humangenome project,HGP)的提出和完成,对人类疾病的认识和治疗开match启了全新的篇章,在此背景下中药学研究逐渐深入到基因组水平,从而导致本草基因组学的产生。
1977 年Sanger 完成首个物种全基因组测序,即噬菌体ΦX174 基因组,大小为5.836 kb;人类基因组计划由美国科学家于1985 年率先提出,1990 年正式启动,六国共同参与,2000 年完成,是一项规模宏大,跨国、跨学科的科学探索工程,其旨在测定组成人类染色体(指单倍体)中所包含的30 亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。2000 年破译的拟南芥(Arabidopsisthaliana)全基因组,大小为125Mb,作为第一个植物全基因组测序在植物科学史上具有里程碑意义。中国药用植物有11 146 种,约占中药材资源总数的87%,是所有经济植物中最多的一类。同时,药用植物也是许多化学药物的重要原料,目前1/3 以上的临床用药来源于植物提取物或其衍生物,其中最著名的青蒿素来源植物是黄花蒿。
中国学者应用光学图谱和新一代测序技术,完成染色体水平的灵芝基因组精细图绘制(图1),通过基因组解析提出灵芝为首个中药基原的药用模式真菌,文章发表在《自然通讯》上,期刊编辑部以特别图片(featured image)形式进行了推介(图2),认为该论文表明灵芝对于研究传统菌类中药的次生代谢途径及其调控是一个有价值的模式系统。论文发表当天,《今日美国》(USA Today)以“揭秘中国‘仙草’基因组”为题报道了该研究成果(图3),该论文被Nature China 网站选为中国最佳研究(图4)。灵芝基因组图谱的公布为开展灵芝三萜等有效成分的合成研究提供了便利,随着这些合成途径的逐步解析,使得通过合成生物学合成灵芝有效成分成为可能。同时,对灵芝生长发育和抗病抗逆关键基因的发掘及认知,将推动灵芝的基因组辅助育种研究,加速灵芝新品种的培育,并为灵芝的科学栽培和采收提供理论指导。
图1 灵芝基因组结构信息(Chen
et al.,2012)
a. 灵芝的GC 含量;b. 灵芝的基因密度;
c. 灵芝的染色体组成;d. 灵芝的基因组
重复区域
图2 《自然通讯》以特别图片形式发表灵芝基因组研究成果(Chen et al.,2012)
图3 《今日美国》报道:“揭秘中国‘仙草’基因组”
图4 灵芝基因组论文被 Nature China 网站选为中国最佳研究
2009 年,陈士林团队提出本草基因组计划,即针对具有重大经济价值和典型次生代谢途径的药用植物进行的全基因组测序和后基因组学研究。全基因组测序、组装和分析策略:测序物种的筛选原则,待测物种基因组预分析,测序平台的选择,遗传图谱和物理图谱的绘制,全基因组的组装及生物信息学分析;模式药用植物突变体库的建立和基因功能研究;药用植物有效成分的合成及其调控研究;药用植物抗病、抗逆等优良性状的遗传机制研究及优良品种选育。在此基础上,详细介绍了本草基因组方法学研究:全面介绍物种基因组大小、染色体数目测定方法、第二代高通量测序方法、全基因组组装和基因组注释方法、基因组比较等生物信息学分析手段、简要阐述重测序在药用植物全基因组研究中的应用方法。由此,本草基因组学逐渐形成和完善,包括中草药结构基因组、功能基因组、基因组辅助分子育种、中草药表观基因组、中草药宏基因组、中草药蛋白质组学、中药合成生物学、中药代谢组、药物基因组学、中草药生物信息学及数据库等内容。基于分子生物学和基因组学的药用植物鉴别是当前研究的活跃领域,用于鉴别的分子生物学和基因组学技术有扩增片段长度多态性(AFLP)、限制性内切酶片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、DNA 微阵列技术(microarray)、DNA 条形码(barcoding)等,基于基因组鉴别的分子基础是植物分子系统发育关系反映物种进化关系。在这些技术中,药用植物DNA 条形码鉴定策略及关键技术是最受关注的方向,中药材DNA 条形码分子鉴定指导原则已列入《中华人民共和国药典》(简称《中国药典》)2010 版增补本Ⅲ和《中国药典》2015 版。
2. 本草基因组学的发展
2015 年国际期刊《科学》(Science)增刊详述“本草基因组解读传统药物的生物学机制”,提出本草基因组学为药用模式生物、道地药材研究、基因组辅助育种、中药合成生物学、DNA 鉴定、基因数据库构建等提供理论基础和技术支撑(图5)。目前,药用植物基因组学与生物信息学已经进入快速发展阶段,必将对传统药物学产生巨大影响。国内外已经开展青蒿、丹参、西洋参、甘草等多种药用植物的大规模转录组研究。基因组序列包含生物的起源、进化、发育、生理以及与遗传性状有关的一切信息,是从分子水平全面解析各种生命现象的前提和基础。第二代高通量测序技术的飞速发展及第三代单分子测序技术的兴起使测序成本大大降低、测序时间大大缩短,为本草基因组计划的实施奠定了坚实的技术基础。目前,赤芝、紫芝、丹参及铁皮石斛等重要药用植物的基因组已被公布,人参、苦荞、穿心莲、紫苏等中草药基因组图谱也完成绘制。为解析丹参的遗传背景,陈士林团队联合国内外著名高校和研究机构,通过联合测序技术完成了丹参基因组图谱的组装,丹参基因组的完成代表着首个鼠尾草属物种基因组图谱的成功绘制。进化分析显示,丹参与芝麻的亲缘关系更近,估计其分化时间约为6700 万年前(图6)。丹参基因组的发表推动药用模式植物研究体系的确立。本草基因组学将使中草药生物学研究进入一个崭新的时代——本草基因组时代。
图5 本草基因组学搭建传统药物和现代生命科学研究桥梁
match
图6 丹参基因组的进化分析(Xu et al.,2016)
A. 丹参、狸藻、芝麻、番茄和葡萄基因组注释基因家族的进化关系;B. 水稻、拟南芥、葡萄、番茄、马铃薯、狸藻、芝麻和丹参8 个基因组的
1824 单拷贝基因构建系统进化树,预测其基因组分化时间
3. 学科内涵和外延
根据本草基因组学产生和发展的过程,主要从三个方面确定学科的内涵,即理论体系、实验技术和应用方向(图7)。本草基因组学形成了高度综合的理论体系,包括从基因组水平研究本草的九大内容:中草药结构基因组、中草药功能基因组、中草药转录组和蛋白质组、中草药表观基因组、中草药宏基因组、中药代谢组、中药合成生物学、中药基因组学、中药生物信息学。本草基因组学实验主要包括九大技术:高通量测序技术、遗传图谱构建技术、光学图谱构建技术、基因文库构建技术、突变库构建技术、组织培养与遗传转化、蛋白质分离纯化与鉴定、四大波谱技术及联用、基因组编辑技术。基于本草基因组学的理论体系和实验技术,形成了该学科的七大应用方向:药用模式生物研究、阐明道地药材形成机制、基因组辅助育种、中药质量评价和控制、基因资源的保护和利用、中药新药研发、指导相关学科研究。
图7 本草基因组学的学科内涵
本草基因组学的学科外延与本草学、中药学、基因组学、生物信息学、分子生物学、生物化学、生药学、中药资源学、中药鉴定学、中药栽培学、中药药理学、中药化学等密切相关(图8)。本草学和中药学为本草基因组学奠定了深厚的历史基础和人文基础,为本草基因组学研究对象的确定提供了丰富的候选材料;基因组学和生物信息学为本草基因组学提供了前沿理论和技术支撑,分子生物学、生物化学、中药化学则为本草基因组学提供基础理论和基本实验技术支持,生药学、中药资源学、中药鉴定学、中药栽培学与本草基因组学互相支撑发展,各学科的侧重点不同;中药药理学、中药化学为本草基因组学的应用提供技术支持。与以上各学科相呼应,本草基因组学促进本草学和中药学从经典走向现代、从传统走向前沿,为中医药更好服务大众健康提供强大知识和技术支撑,扩大了基因组学和生物信息学的研究对象及应用领域,为分子生物学、生物化学、中药化学走向实践应用提供了生动案例,推动生药学、中药资源学、中药鉴定学、中药栽培学从基因组和分子水平开展研究,为中药药理学的深入研究提供理论和技术支持。
图8 本草基因组学的学科外延
match
本草基因组学的研究内容
本草基因组学借助基因组研究最新成果,开展中草药结构基因组、中草药功能基因组、中草药转录组和蛋白质组、中草药表观基因组、中草药宏基因组、中药合成生物学、中药代谢组、中药基因组学、中草药生物信息学及数据库等理论研究,同时对基因组研究相关实验技术在本草学中的应用与开发进行评价,推动本草生物学本质的揭示,促进遗传资源、化学质量、药物疗效相互关系的认识。(由于篇幅原因,本文略去书中详细阐述本草基因组学的研究内容)
本草基因组学的实践应用
本草基因组学作为前沿科学,具有很强的理论性,同时该学科涉及的技术方法和理论对中医药实践具有巨大的指导意义。例如,基于中草药结构基因组开发的DNA 条形码分子鉴定技术被国际期刊《生物技术前沿》以题为“草药鉴定从形态到DNA 的文艺复兴”发表,给传统中药鉴定带来革命性影响;基于中草药功能基因组和中草药表观基因组研究阐明道地药材的形成机制,对优质中药生产和栽培技术的改进提供指导;基于本草基因组学构建的基因数据库、代谢物数据库、蛋白质数据库,以及开发的相关生物信息学方法等,为中药药理学、中药化学、新药开发等提供战略资源;基于合成生物学技术实现目标产物的异源生产具有环境友好、低耗能、低排放等优点,为天然药物研发提供全新方式。
1. 道地药材的生物学本质研究
道地药材是优质药材的代表,既受遗传因素的控制,又受环境条件的影响。组学技术可提供有用工具阐明道地药材的分子机制。例如,道地药材“沙漠人参”肉苁蓉(Cistanche deserticola)是中国最具特色的干旱区濒危药用植物和关键物种,新疆和内蒙古是其重要主产区和传统道地产区,研究表明,内蒙古阿拉善高原和新疆北疆是肉苁蓉两大生态适宜生产集中区(两类生态型),黄林芳等(2014)对两大产区肉苁蓉化学成分、分子地理标识及生态因子进行考察,应用超高效液相色谱- 四极杆飞行时间质谱(UPLC-QTOF/MS)技术对肉苁蓉苯乙醇苷及环烯醚萜苷类成分进行分析;基于psbA-trnH 序列对不同产地肉苁蓉进行分子鉴别及分析;通过“中国气象科学数据共享服务网”,获得两大产区包括温度、水分、光照等生态因子数据;运用生物统计、数量分类等分析方法对肉苁蓉进行生态型划分。UPLC-QTOF/MS 分析表明,内蒙古与新疆产肉苁蓉明显不同,鉴定出16 种成分,其中2′- 乙酰毛蕊花糖苷可作为区分两大产地肉苁蓉的指标成分;psbA-trnH 序列比对分析发现,肉苁蓉不同产地间序列位点存在差异,新疆产肉苁蓉在191 位点为G,内蒙古产则为A,邻接树(NJ tree)分析表明,肉苁蓉两个产地明显分为两支,差异显著;生态因子数据也表明,肉苁蓉的两大气候地理分布格局为研究不同生态区域中药生态型及品质变异的生物学本质提供了一种新思路,也为深化道地药材理论研究奠定重要基础(图9)。
图9 肉苁蓉道地药材特征基因(黄林芳 等,2014)
另外,针对同一药材在不同种植区域开展中草药表观基因组研究,包括DNA 甲基化修饰、小RNA测序分析、染色质免疫共沉淀分析等,明确不同生产区域的遗传变异,特别是环境不同对药材表观遗传的修饰作用。此外,土壤微生物也是道地药材生长环境中的重要因素。采用宏基因组分析土壤微生物群落,为揭示土壤微生物和药材生长的相互作用提供依据。
2. 中药分子标记用于中药质量控制
本草基因组和功能基因组研究为开发药材分子标记提供了丰富基因资源。基于基因组的分子标记有AFLP、简单重复序列区间(ISSR)、单核苷酸多态性(SNP)等,基于转录组的分子标记有SSR 等。当前国际上最受关注的分子标记是DNA 条形码,已经构建标准操作流程以及数据库、鉴定软件,可广泛应用于中药企业、药房、研究院所和大专院校等。中药材DNA条形码分子鉴定指导原则已被纳入《中国药典》,植物药材以ITS2 序列为主、psbA-trnH 为辅助序列,动物药材以COI 序列为主、ITS2 为辅助序列,在此基础上,进一步开发了质体基因组作为超级条形码对近缘物种或栽培品种进行鉴定。该体系可广泛应用于中药材种子种苗、中药材、中药超微破壁饮片、中成药等鉴定,已出版专著《中国药典中药材DNA 条形码标准序列》和《中药DNA 条形码分子鉴定》。
3. 本草基因资源的保护与利用
随着本草基因组研究的发展,本草遗传信息快速增加,迫切需要一个通用平台整合所有组学数据。数个草药数据库已经被建立,如草药基因组数据库、转录组数据库、草药DNA 条形码数据库、代谢途径数据库等。但是这些数据库缺乏长期维护,对使用者要求具备一定生物信息学技能。因此整合DNA 和蛋白质序列、代谢组成分信息,方便使用的大数据库十分必要和迫切。进一步提升生物信息分析方法,更好地利用基因组和化学组信息解析次生代谢产物的生物合成途径,将有助于有效设计和寻找植物及真菌药物。
利用简化基因组测序技术获得数以万计的多态性标记。通过高通量测序及信息分析,快速鉴定高标准性的变异标记(SNP)已广泛应用于分子育种、系统进化、种质资源鉴定等领域。利用该技术可以筛选抗病株的特异SNP 位点,建立筛选三七抗病品种的遗传标记,辅助系统选育,有效的缩短育种年限;通过系统选育方法获得的抗病群体,并采用RAD-seq 技术筛选抗病株的SNP 位点,为基因组辅助育种提供遗传标记,进而有效缩短三七的育种年限,加快育种进程。
4. 中药合成生物学研究
结构复杂多样的中药药用活性成分是中药材发挥药效的物质基础,也是新药发现的重要源泉。然而许多中药材在开发和使用的过程中往往面临一系列难题。例如,许多药材生长受环境因素影响较大;有些珍稀药材生长缓慢,甚至难以人工种植;大多数药用活性成分在中药材中含量低微,结构复杂,化学合成困难;传统的天然提取或人工化学合成的方法难以满足科研和新药研发的需求;等等。中药合成生物学将是解决这一矛盾的有效途径。中药合成生物学是在本草基因组研究基础上,对中药有效成分生物合成相关元器件进行发掘和表征,借助工程学原理对其进行设计和标准化,通过在底盘细胞中装配与集成,重建生物合成途径和代谢网络,实现药用活性成分定向、高效的异源合成,从而提升中国创新性药物的研发能力和医药产业的国际核心竞争力。
中药合成生物学研究策略包括以下方面:中药药用活性成分次生代谢途径的解析;生物元件的挖掘、设计与标准化;底盘细胞设计与构建;代谢途径的装配与集成、活性成分的合成及结构鉴定;代谢网络的优化设计与重构。随着基于高通量测序的中药转录组学及中药基因组学研究的快速及深入发展,将会积累海量的中药原物种的遗传信息,利用生物信息学技术和功能基因组学方法从这些信息中筛选和鉴定出特定次生代谢途径的酶基因,将极大加快次生代谢途径的解析进程,为中药合成生物学研究奠定坚实的前期基础。通过优化密码子偏好性(外源基因的宿主化)、提高关键酶基因的表达量、下调或抑制代谢支路等方法来优化和改造异源代谢途径,最终实现药用活性成分的高效快速合成。
5. 中药作用靶点与个性化治疗
中药蛋白质组学将蛋白质组学技术应用于中药研究领域,对寻找中药的可能靶点和阐明中药有效成分作用机制具有重要意义。例如,蒋建东教授团队在小檗碱降血脂研究中开展的突出工作,Pan 等利用蛋白质组学技术分析丹参酮Ⅱ A 对宫颈癌Caski 细胞的抑制作用,发现C/EBP 同源蛋白和细胞凋亡信号调节激酶1 参与丹参酮Ⅱ A 的抑癌作用。在中药复方的相关作用靶点研究中,Nquyen-Khuong 等探讨了由栝楼、大豆、中药五味子和西地格丝兰提取物组成的混合物作用于人膀胱癌细胞后蛋白质组的表达谱变化,鉴定了多种与能量代谢、细胞骨架、蛋白质降解及肿瘤抑制相关的蛋白质。
青蒿素及其衍生物青蒿琥酯表现出明显的体内外抗肿瘤活性,但其抗肿瘤的分子机制并不明确。研究者采用基因芯片技术,在转录水平解析青蒿琥酯抗肿瘤相关的基因,再将表达谱数据导入信号通路分析和转录因子分析,结果表明,c-Myc/Max 可能是作为肿瘤细胞应对青蒿琥酯效应基因的转录调控因子,这一结果可能指导针对不同个体采用不同的治疗策略。由于银杏具有显著的诱导CYP2C19 活性效应,通过研究不同CYP2C19 基因型健康中国人个体中银杏与奥美拉唑潜在的中西药互作关系,发现银杏诱导CYP2C19 基因型模式依赖的奥美拉唑羟基化反应,随后降低5- 羟基奥美拉唑肾脏清除率。银杏和奥美拉唑或其他CYP2C19 底物共同服用可显著减弱其药效,但还需更多证据支持。这一研究证实个体化治疗基于人体基因差异,可能发挥更好疗效。
本文摘编自陈士林等编著《本草基因组学:中药组学的发展与未来》第一章“概述”部分(北京:科学出版社,2016.12),内容有删节。
ISBN 978-7-03-051288-8
责任编辑:曹丽英 贾冬梅 刘亚
本草基因组学作为中草药研究的热点领域,在中药现代化发展中发挥着重要作用。本书作者长期工作在本草基因组学研究一线,结合各自研究工作介绍了本草基因组学的主要研究内容及其应用。《本草基因组学:中药组学的发展与未来》第一章至第八章为基础篇,包括概述、结构基因组学、转录组学、功能基因组学、蛋白质组学、代谢组学、表观基因组学和宏基因组学等;第九章至第十五章为应用篇,包括药用模式生物、中药合成生物学、基因组辅助育种、DNA 鉴定、中药体内代谢基因组研究、关键实验技术和生物信息学及数据库等。本书图文并茂,注重科学性、实用性,可为从事本草基因组学教学和研究的人员、中医药大学的本科生和研究生提供参考和借鉴。
(本期责编:王芳)
一起阅读科学!
科学出版社│微信ID:sciencepress-cspm
专业品质 学术价值
原创好读 科学品味
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 12:06
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社