许崇峰 杨芃原 岳贵花 卞利萍
摘 要 对质谱DNA序列测定的各种技术的原理、进展、面临的困难以及发展的前景作了评述。
关键词 质谱 DNA序列测定 评述
Abstract This article gives a review on DNA sequencing by mass spectrometry,including the principles of MS techniques,and their progress,difficulties and perspective.
Key words Mass spectrometry;DNA sequencing;Review
1 引言
DNA序列分析在生物基因学以及遗传病和病毒性疾病的诊断和治疗上具有重要的作用。用质谱化学方法进行DNA序列分析是一种新兴的技术。Sanger双脱氧链终止序列测定方法[1]是常规的DNA序列分析方法,Sanger产物需要通过凝胶分离和显色来得到DNA的序列信息。而当采用质谱(MS)时,Sanger产物可不需分离而直接测定,因而质谱方法具有快速性的优点。80年代中后期相继出现的质谱离子化新技术电喷雾(ESI)和基体辅助激光解析电离(MALDI)使得用质谱进行DNA序列测定成为可能。但是由于技术尚不成熟,目前使用质谱方法仅能测定含几十个碱基的寡聚核苷酸。要使质谱在人类基因工程(HGP)和临床分析中得到广泛的应用,质谱技术和质谱方法必须得到显著改善。
2 生物质谱方法
生物质谱,有别于传统质谱,测定的对象是分子量可高达几万至几十万的生物分子,这使得传统的电子轰击(EI)、化学电离(CI)等电离技术的应用受到了极大的限制。随着快原子轰击(FAB)、MALDI、ESI、离喷雾(IS)、大气压下碰撞电离(APCI)等电离技术的出现,大大提高了质谱的测定范围。特别是ESI-MS和MALDI-MS显示了在生物大分子分析(如蛋白质和核酸)上的巨大潜力。
2.1 ESI-MS
电喷雾是一种软电离方法。通常认为电喷雾可以用两种机制来解释:1)离子蒸发机制,在喷针针头与施加电压的电极之间形成了强电场,该电场使液体带电,带电的溶液在电场的作用下向带相反电荷的电极运动,并形成带电的液珠(液滴)。由于小雾滴的分散,比表面增大,在电场中迅速蒸发,结果使带电雾滴表面单位面积的场强高达108V/cm2,从而产生液滴的“爆裂”。重复此过程,最终产生分子离子;2)带电残基(分子)机制,首先也是电场使溶液形成带电雾滴,带电雾滴在电场作用下运动并迅速溶去,溶液中分子所带电荷在去溶时被保留在分子上,结果形成离子化的分子。一般来讲,电喷雾方法适合使溶液中的分子带电而离子化。离子蒸发机制是主要的电喷雾过程,但对质量数大的分子化合物,带电残基的机制也会起相当重要的作用。
电喷雾所形成的离子是多电荷离子,由于质谱测定的是质荷比,这就拓宽了它所能测定的质量范围,使得它适合于生物大分子的测定。
2.2 MALDI-MS
MALDI也是一种软电离方法,它利用激光束照射分散于基体(又称基质、底物)中的样品,由于样品被包裹在基体中,因而大部分激光能量被基体所吸收,从而保护了样品分子。MALDI中的基体起到了多种重要的作用:从脉冲激光中吸收足够的能量;隔离样品分子;提供光激发的酸或碱基团,以及在离子-分子碰撞中电离样品分子。目前MALDI比较公认的机理是:激光光束的能量首先被发色团的基本吸收,接着这些基体迅速蒸发为气相,被包含的分析物的分子从而被带入气相。而离子化的产生是由于受激的基体分子将质子转移给分析物分子。
MALDI可以由不同类型的质谱来实现,特别是飞行时间质谱(TOF)。理论上,飞行时间质谱的质量上限是无限的,这决定了它特别适合于生物大分子分子量的测定。
目前,质谱DNA测定通常采用以下3种策略:(1)梯度测序;(2)Sanger产物的质量分析;(3)气相裂解测序。
梯度测序是用DNA外切酶来连续地断裂核苷酸链,根据相应质量变化来确定碱基组成。梯度测序所需的质量分辨率和准确度要远比Sanger测序严格。在梯度测序中,为区分A和T,必须测出9道尔顿的质量差异。然而在Sanger测序中只要测定出300道尔顿的质量差异就已足以确定顺序。酶消解的费时以及该方法对仪器的高要求使得该方法面临诸多困难。
Sanger产物质量分析是寡聚核苷酸序列测定的最直接的办法,只是用质谱替代凝胶电泳。与凝胶电泳比较,质谱具有潜在的时间和费用优势:传统的凝胶分离可能需要几小时,而质谱测定常常可以在一分钟内完成。
气相裂解法是通过亚稳态或碰撞诱导解离的碎片离子的质量分析来完成测序。气相裂解测序的优点是比那些依赖于溶剂相化学的方法快得多。但是它的缺点也很明显:碎片谱很复杂,难以解释;对质量分辨率和质量测定准确度的要求要等于或高于梯度测序。下面我们将叙述后两种策略。
4.1 Sanger产物质谱分析
人类基因工程(HGP)要求测定人类基因的一级结构。对于HGP那样大规模的测序工程,高效、高准确度和易于自动化是至关重要的。在我们前面所谈到的3种质谱测序方法中,梯度测序很费时,而气相裂解方法到目前为止还未在未知序列的寡聚核苷酸测定上显示出速度和准确度的优势。因此,普遍的认为是,应当将质谱应用在Sanger方法中来测定序列。
Sanger产物质谱分析的一个重要方面是质量分辨率。Sanger产物有4个系列,因而可得到了4张质谱图。这4张谱图的结果必须综合起来以得到完全的顺序信息。谱图上可能出现的最近的两个峰是仅相差一个C残基的两个离子(质量相差289道尔顿)。这样,要分辨100链的寡聚核苷酸分辨率要达到100,这是TOF-MS能达到的,但是由于亚稳态衰变和加合物峰的存在,实际上必须达到更高的分辨率。
Fitzgerald[14]等最早进行了Sanger产物的质谱测序。此后,Shaler[15]等使用一个12链的前体,能读出一个寡聚物的前19个碱基的顺序;而使用一个21个链的前体读出了该寡聚物的前24个碱基的顺序。Roskey[16]等对于一个50个碱基的模板,使用含13个碱基的前体和高分辨的DE-MALDI-TOF-MS获得了前32个碱基的序列。
尽管前面的研究表明使用MALDI可分析Sanger反应所产生的前体延伸产物,但是该方法还面临着许多问题,如大链长时的离子丰度太低,在每一个测序反应中都产生了错误的离子信号(这会妨碍对DNA未知区域的辨认),而且该方法仅能给出相当短的寡聚核苷酸链的完整的序列信息。要使质谱取代凝胶电泳在Sanger方法中的位置,MALDI技术需要取得长足的进步。
4.2 气相裂解序列测定
由前面的讨论,我们知道成功的DNA序列测定必须尽量避免产生碎片离子。但是,在某些场合,碎片是很有用的,因为它携带了结构信息。气相裂解序列分析就是利用碎片来进行序列分析的。气相裂解方法通常有3种策略,分别为解吸/离子诱导裂解,串级质谱和结合光解的采样板和分离锥的CID技术。下面将介绍第2种策略--串级质谱。
在串级质谱的寡聚核苷酸的序列测定研究上,McLuckey[18~20]等作了许多创新性的研究工作。他使用离子阱质谱分析ESI所产生的寡聚核苷酸离子,得到碰撞诱导电离谱(CID)。他们在多电荷寡聚核苷酸的裂解机理上做了许多工作,MuLuckey还提出了标示寡聚核苷酸裂解产物的系统的命名方法[19]。现在,这种命名方法被该领域的研究者所广泛的使用。Baker,Barry,Boschenok和Ni等人的研究小组分别进行了ESI的三维四级质谱研究;而Little等人则研究了使用ESI-FT-ICR-MS/MS来进行序列测定。
1996年,Ni[17]等首次使用串级质谱测定了未知寡聚核苷酸序列。串级质谱研究工作的最大的成果可能是他们发展的通常模式下寡聚核苷酸的顺序建构算法。该算法的产生可能大大的加快用串级质谱进行DNA序列测定的进程。
5 改性的寡聚核苷酸的序列测定
我们前面所讨论的策略通常适合于任何类型的寡聚核苷酸,特别地,质谱在寡聚核苷酸改性结构的辨认上具有重要的作用。目前,对改性结构的研究主要集中在甲基磷酸酯寡聚核苷酸和硫代磷酸酯寡聚核苷酸上。
6 结语
我们有理由对质谱DNA序列测定方法抱有谨慎的乐观态度。MALDI-TOF-MS的分辨率的提高和串级质谱解谱技术的发展有可能将质谱DNA测序由研究推向实践应用。而正是质谱的快速和高灵敏度才使得该方法具有诱人的应用前景,从而推动这一领域不断向前发展。