蛋白质工程部氨基酸测序及其蛋白质质量评价

(整期优先)网络出版时间:2022-06-02
/ 5

蛋白质工程部 氨基酸测序及其蛋白质质量评价

何先萍 1 , 李玉萍 1 , 古慧贤 1 , 胡告 2 通讯作者

1. 深圳市药品检验研究院(深圳市医疗器械检测中心)体外诊断试剂部,广东 深圳 518000

2.深圳亚辉龙生物科技股份有限公司,广东 深圳518000

摘要】氨基酸序列是蛋白质和多肽重要的结构,其决定蛋白质的高级结构。氨基酸测序在蛋白质研究中越发重要,高分辨率质谱技术的发展大大促进了氨基酸测序的研究。本文综述了氨基酸测序的方法、原理以及其应用的研究进展,随着质谱技术的不断发展,新的测序方法不断建立,氨基酸测序将在蛋白质研究中发挥更大的作用。

关键词】蛋白质;氨基酸测序;质谱技术;从头测序


蛋白质是一类最重要的生物大分子,在生物体内占有特殊的地位。其一级结构是由多肽链主链上共价连接的氨基酸残基决定的,二级结构和其它高级结构主要是由非共价力如氢键、离子键、范德华力和疏水作用决定的。一级结构中氨基酸序列的排列决定蛋白质高级结构的生物学活性。因此,氨基酸序列测定具有非常重要的意义。

氨基酸序列测定一般需要测定其相对分子质量、等电点、N-末端肽段序列和C-末端肽段序列,虽然测定每种蛋白质的氨基酸序列都有自己特殊的问题需要解决,但是氨基酸测定的一般方法都可以概括为:①测定蛋白质分子中多肽链的数目,根据蛋白质N-末端或C-末端残基的摩尔数和蛋白质的相对分子质量可以确定蛋白质分子中的多肽数目;②拆分蛋白质分子的多肽链,断开多肽链间的二硫键,如果蛋白质分子是由一条以上多肽链构成的,则这些链必须加以拆分;③鉴定多肽链的N-末端残基和C-末端残基,裂解多肽链成较小的片段,测定各肽段的氨基酸序列,目前最常用的肽段测序方法有Edman降解法[1]、酶解法和质谱法;④运用软件重建完整多肽链的一级结构,确定二硫键的位置,利用两套或多套肽段的氨基酸序列彼此间交错拼凑出完整多肽链的氨基酸测序。目前氨基酸序列测定的方法主要有化学降解法、酶降解法和质谱法以及核苷酸序列的推定法,每种方法都有其自身的优势和劣势,以前面三种测序方法最为常用。

1化学降解法

化学降解法是指蛋白质或多肽物质与相应的化学试剂反应后,专一裂解多肽链肽段并检测相关裂解片段的方法,包括N-末端肽段序列测定法和C-末端肽段序列测定法。N-末端肽段序列测定的方法主要有苯异硫氰酸酯(PITC)法,C-末端肽段序列测定的方法主要有(异)硫氰酸法。其它化学方法,如二硝基氟苯(DNFB或FDNB)法、过氟酸酐法[2]等由于并不常用,所以在这里不做介绍。

1.1苯异硫氰酸酯(PITC)法 1950年,瑞典有机化学家Edman P.[3]首先提出用于鉴定蛋白质或多肽的N-末端氨基酸序列测序的方法—Edman化学降解法[1],此方法又称为苯异硫氰酸酯(PITC)法,Edman降解法一般分三步进行,包括第一步偶联反应、第二步环化断裂反应和第三步转化反应,即Edman降解试剂(PITC)与多肽链的游离α-末端氨基酸作用,生成苯氨基硫甲酰多肽或蛋白质(PTC-多肽或蛋白质),后者在酸性有机溶剂中加热时,N-末端的PTC-氨基酸发生环化,生成苯乙内酰硫脲的衍生物并从肽链上掉下来,除去N-末端氨基酸后剩下的肽链仍然是完整的,因为PTC基的引入只使第一个肽键的稳定性降低。反应液中代表N-末端残基的PTH-氨基酸在紫外区有强吸收,可用气相色谱、薄层层析和质谱等检测技术进行鉴定。

1.2(异)硫氰酸法 1926年,Schlack和Kumpf[4]提出了用于鉴定蛋白质或多肽的C-末端氨基酸序列测定方法—Schlack-Kumpf化学降解法,该方法又称为(异)硫氰酸法[5],与Edman化学降解法原理相似,(异)硫氰酸法一般分四步进行,包括第一步羟基活化、第二步偶联反应、第三步环化反应和第四部裂解反应[610]。即异硫氰酸与蛋白质或多肽的α-羧基反应,生成蛋白质或多肽乙内酰硫脲,再用裂解试剂切下C末端的氨基酸残基,生成氨基酸乙内酰硫脲,最后用HPLC、质谱等技术分析游离的氨基酸乙内酰硫脲。

1.3化学降解法在蛋白质测序中的应用 随着蛋白质测序技术的快速发展和蛋白质序列分析仪的推出和逐步完善,经典的Edman降解法已经广泛应用于蛋白质的N-端测序,而与N-末端测序相对应的C-末端测序也得到迅速发展。陈文章[11]等在微流控芯片上完成Edman降解反应,大幅度提高Edman降解法测序的灵敏度,并与质谱技术联用,提高痕量蛋白质序列鉴定的准确度。同时通过在微流控芯片上进行一个循环的降解,准确地得到多肽端氨基酸残基的信息,解决了MS/MS谱图内难以辨别b/y系列离子的难题,并成功地完成了三个多肽样品(包括一个C端修饰的神经多肽)的从头测序。Bergman等[12]测定了200多个多肽和蛋白质的C末端序列,在pmol水平能准确测到4~5个氨基酸残基序列。蛋白质或多肽的结构对测序过程会有很大影响,因此,具体能准确测定多少氨基酸残基序列还要视蛋白质及多肽结构而定。

2酶降解法

在蛋白水解酶中有一类酶称肽链外切酶或称外肽酶,如氨肽酶和羧肽酶,他们分别是从肽链N-末端和C-末端逐个地向里切,只要能跟随酶水解的过程分别定量测试释放的氨基酸,便能确定多肽的氨基酸序列,从而达到鉴定蛋白质或多肽序列。

2.1羧肽酶法[13] 羧肽酶是一类肽链外切酶,它专一地从肽链的C-末端开始追个降解,释放出游离氨基酸。被释放的氨基酸数目与种类随反应时间而变化,根据释放的氨基酸数目(摩尔数)与反应时间的关系,便可以知道该肽段的C-末端氨基酸序列。目前测定C-末端残基的各种方法中,以羧肽酶法最为有效,也最常用。常用的羧肽酶有4种,即羧肽酶A、羧肽酶B、羧肽酶C以及羧肽酶Y。其中羧肽酶A和羧肽酶B分别来自牛胰和猪胰,羧肽酶C得自柑橘叶,羧肽酶Y取自面包酵母。研究得最多使用最广范的是羧肽酶A和羧肽酶B,羧肽酶A能释放除Pro、Arg和Lys之外的所有C-末端残基,而羧肽酶B只水解以碱性氨基酸Arg和Lys为C-末端残基的肽键。羧肽酶A和羧肽酶B的混合物能释放除Pro以外的任一C-末端残基。羧肽酶C是专门水解肽链羧基端(C端)倒数第二位由Pro形成的的肽键,在一些文献中,并不叫羧肽酶C,而被称为羧肽酶P。羧肽酶Y可以作为于任何一个C-末端残基,它能非特异性地裂解C端包括Pro在内的所有氨基酸残基,并且能酶解乙酰化等修饰的氨基酸残基。

2.2氨肽酶法 氨肽酶是一类肽链外切酶或叫外肽酶,它们能从多肽链的N-末端追个地向里切,根据不同的反应时间测出酶水解所释放的氨基酸种类和数量。实际上此法用于测定N-末端和末端残基序列有许多困难,因为酶对各种肽键的敏感性不一样,常常难以判断哪个残基在前,哪个残基在后。最常用的氨肽酶是亮氨酸氨肽酶,亮氨酸氨肽酶并不是只能水解以Leu为N-末端残基的肽段,而是水解以Leu为N-末端的肽键速度最快。

2.3酶降解法在蛋白质测序中的应用

  1. 末端测序过程中,经常会碰到N-末端残基的氨基酸被封闭,使其不能与Edman降解试剂发生作用。N-末端残基受封闭的种类有很多,如焦谷氨酰环化、乙酰化以及某些环化。当遇上肽链N-末端是焦谷氨酰残基时,可以使用焦谷氨酰氨肽酶处理,它是专门裂解焦谷氨酰N-末端的外肽酶,N-末端残基的焦谷氨酸可以用层析法来鉴定,剩下的肽链可以使用Edman降解法进行鉴定。在用酶降解法测序C-末端肽段中,曾嵘等[14]采用此方法,以乙酸酐为活化试剂,四丁铵硫氰酸为偶联试剂,溴甲基萘为烷化试剂,将多肽或蛋白质的C端序列依次裂解为ATH-氨基酸进行检测。他们对20多种重组或天然的多肽或蛋白质进行了C末端肽段序列分析,获得了不同长度的C末端肽段序列信息,一般可在1nmol水平上准确测定3~5个氨基酸残基,最多可准确测定达10个以上氨基酸残基。


3质谱法

质谱(MS)法是一种化学分析形式,用于测量样品中原子或分子的质荷比(m/z)。它还能区分同一元素的同位素。根据质谱仪的类型,这些测量通常可用于确定样品组分的确切分子量并鉴定未知化合物组成。基于质谱数据的蛋白质鉴定算法的不同,可以将质谱法主要分为两类:传统的数据库搜索比对和肽段从头测序。在传统测序中,往往只能检测蛋白消化后的部分肽段序列,再用这些肽段序列与已知的蛋白数据库进行比对,根据一定算法打分,推算出可能性高的蛋白和序列。蛋白质从头测序法的一大特点就是可以不借助任何数据库信息,直接对蛋白质的序列进行分析。相比传统的质谱数据库搜索法有着不可比拟的优势,可以应用于分析新物种的蛋白质序列,以及基因组未被测序的物种的蛋白质序列。

3.1传统数据库比对蛋白质测序方法 质谱技术由于具有高灵敏度、高准确性、高通量、高分辨率、耐盐性、耐杂质性和谱图解析简单等优点已被广泛用于蛋白质鉴定和蛋白质组学等方面的研究。尤其是电喷雾(electraspray ionization,ESI)和基质辅助激光解吸电离-飞行时间(matrix-assisted laserd desorption/ionization time-of-fight,MALDI-TOF)的出现,使质谱技术在蛋白质结构和功能分析中发生了革命性的飞跃。

3.1.1电喷射电离质谱法(ESI-MS 电喷射电离质谱法(ESI-MS)[15]是蛋白质溶液在高电场中通过毛细管静电分散成携带高电荷的微液滴,然后蛋白质离子微滴以喷雾的形式进入气相,最后进入串联质谱分析仪。串联质谱允许蛋白质离子在两台串联在一起的质谱仪上进行分析。第一台质谱仪用于从蛋白质水解液中分离寡肽,然后选出每一寡肽进行下一步分析,在进入第二台质谱仪的过程中,选出的寡肽于碰撞池中通过与氮气或氩气分子碰撞裂解成离子碎片,这些碎片被吸引入第二台质谱仪中进行分析。裂解主要发生在寡肽中连接相继氨基酸的肽键上,因此产生的碎片是只差一个氨基酸残基的肽键的相对分子质量。这样加上被裂解掉残基R基相对分子质量,其范围从1(Gly)到130(Trp)。由于这个差值是按时间的各个特征值,因此可以根据离子碎片的质量差值来推定氨基酸序列,其中亮氨酸和异亮氨酸分离需要另做处理才能分开。

3.1.2基质辅助激光解吸电离-飞行时间质谱法(MALDI-TOF MS 基质辅助激光解吸电离-飞行时间质谱法(MALDI-TOF MS)[16]是将多肽成分转换成离子信号,并依据m/z值来对该多肽进行分析,以判断该多肽是哪种蛋白。待检样品与化学基质混合,经过处理后,然后将样品置于激光离子发生器中。激光激活产生的能量作用于多肽,使之由固态样品混合物变成气态。由于多肽分子倾向于吸收单一光子,故多肽离子带单一电荷。形成的多肽离子直接进入飞行时间质量分析仪。最后,由电脑软件将探测器获得的多肽m/z值同数据库中不同蛋白经蛋白酶降解后所形成的特定多肽的m/z值进行比较,以鉴定该多肽源自何种蛋白。MALDI-TOF/MS具有操作简便、准确度高、敏感度高以及分辨率高的特点,同许多蛋白分离方法相匹配,而且,现有数据库中有充足的关于多肽m/z值的数据,因此成为许多实验室的首选蛋白质谱鉴定方法,它的出现为生命科学等领域提供了一种较为新颖和有力的分析测试方法。

3.1.3串联质谱法(MS/MS 蛋白质串联质谱法[17]采用了肽段氨基酸序列的特异性,将2个及以上质谱仪器进行联合运用,通过检索肽质量数据库可以可靠准确的得到蛋白质的信息,其鉴定蛋白质的特异性更高,仅一条肽段就可鉴定蛋白质,可用于蛋白质混和物的鉴定。适当调整后,可鉴定蛋白质翻译后修饰,它是目前鉴定蛋白质常用的方法[18]。目前,三重四极质谱、飞行时间质谱和四极离子肼质谱是应用最广泛的三种串联质谱技术。随着质谱分析技术的发展,各种质量分析技术被引进这个领域,使串联质谱技术在阐明蛋白质结构和功能中起到重要的作用。串联质谱技术是通过离子在运动过程中发生的质量或电荷的变化,研究母离子和子离子的关系,从而获得碎裂过程的信息,进而推测多肽或蛋白质的结构。

3.2蛋白质从头测序方法 蛋白质从头测序是不依赖于任何现有的数据库信息,直接对蛋白质氨基酸序列进行测定的方法。蛋白质从头测序的原理是基于蛋白酶切后的肽段分子在质谱检测中有规律性的断裂,找到特定断裂模式,再根据质谱峰之间质量差即可算出对应的氨基酸信息,以及氨基酸上的翻译后修饰。即使用蛋白酶对分离纯化后的待测蛋白质样品进行酶切,将蛋白质剪切成一定大小的多肽片段(可以分别选用多种蛋白酶进行酶切,以确保蛋白质的全序列可以被鉴定分析到),使用高效液相色谱对肽段酶切产物进行分离纯化,这样有利于接下来更为高效准确的质谱分析。被分离的肽段再经由质谱分析前首先经过软电离处理使肽段带上一定量的电荷,接着飞行进入质谱仪。首先经过一级质谱对肽段离子进行筛选。经过一级质谱筛选后的肽段分子,再进入碰撞室,与室内的He和Ar等惰性气体进行碰撞诱导肽段共价键断裂,产生子离子,再经由二级质谱分析肽段序列。其中,所产生的N-末端碎片离子以英文字母a、b、c表示,C-末端碎片离子以x、y、z表示,如果以常规的碰撞诱导解离活化法,会产生丰度较高的b离子与y离子。再借助特定软件对各个肽段的二级质谱峰进行从头序列分析,最后对肽段序列拼接获得蛋白质全长序列。

3.3质谱法在蛋白质测序中的应用 最早采用MALDI-TOF质谱分析蛋白质是Hillen Kramp等[19]以烟酸为基质辅助紫外激光在TOF谱仪上测出质量数高达60kDa蛋白质,准确度开始只有0.5%,改进后达到0.1-0.2%。Coon等[20]利用最新发展的超分辨率Orbitrap Fusion三合一质谱仪器1 s内鉴定19个肽段,1 h内鉴定3977个蛋白质。张于猛等[21]利用电喷雾技术研究肌红蛋白在不同有机溶剂比列及pH等条件下蛋白质和功能小分子非共价相互作用,最后准确分析出小分子功能结构特征。周岳[22]等利用最新的Orbitrap Exploris 480质谱,优化了DDA、FAIMS DDA、FAIMS DIA的非标记定量方法以及TMT定量策略的关键质谱参数,并将其应用在人细胞蛋白质组、单细胞蛋白质组、血浆蛋白质组和酵母蛋白质组分析,在DDA实验中,使用200 pg和500 pg细胞样品,分别鉴定到1 259和1 725个蛋白质,在FAIMS DDA实验中,分别在60、120和150 min中鉴定6 300、6 994和7 500个蛋白质,在FAIMS DIA实验中,60min内定量到7 019个细胞蛋白和1 077个血浆蛋白,在TMT定量实验中,60 min即可定量10 989个多肽和2 162个蛋白质。质谱技术主要用于检测酶解所得的多肽的质量及柱层析分离所得的蛋白质,也可用于蛋白质高级结构及蛋白质间相互作用等方面的研究[23,24],三条肽段的精确质量数便可鉴定蛋白质。目前,利用2D电泳及质谱技术对整个酵母细胞裂解产物进行分析,已经鉴定出1484种蛋白质,包括完整的膜蛋白和低丰度的蛋白质[25];分析肝细胞癌患者血清蛋白质组成分

[26],并利用质谱进行鉴定磷酸化蛋白研究工作[27]及采用质谱技术研究许旺细胞源神经营养蛋白的分子结构[28]等。

4核苷酸序列推定法

核苷酸序列推定法的依据是生物学上的“中心法则”,细胞内的遗传信息流是DNA到RNA到蛋白质,核酸分子的线性核苷酸序列决定蛋白质分子的氨基酸序列,即由三联体密码子决定氨基酸序列,具体的方法之一是用待测的蛋白质作抗原免疫动物,得到相应抗体,并用此抗体去沉淀合成此种蛋白质的多核糖体,因为在这种多核糖体上含有该蛋白质的模板mRNA和其相连而未被释放的蛋白质多肽链。后者将与加入的抗体发生结合而使多核糖体沉淀,在从沉淀中分离出该mRNA,并将它反转录成cDNA,然后测出cDNA的核苷酸序列,并从它推测出蛋白质的氨基酸序列。由于目前DNA测序技术相当成熟,因此对于用传统的蛋白质化学方法难以测定的相对分子质量大的或生物体内含量很低的蛋白质,此方法将是十分有效的。

虽然推定法很有发展前途,并已被实践所证实,但它仍然需要直接的氨基酸序列分析相配合。如必须知道蛋白质的N-末端和C-末端的残基,否则不可能准确地找到编码序列,如果没有必需的部分氨基酸序列分析,就不可能知道正确的密码读框。总而言之,核苷酸序列测定技术与氨基酸序列测定技术都需要发展,才能把两者有机的结合起来。

结语

综上所述,蛋白质或多肽的氨基酸序列分析,随着一些经典方法和从头测序技术不断地发展和完善,获得了丰富的蛋白质一级结构序列信息,为蛋白质的准确鉴定提供了有力的依据,并加深了我们对蛋白质的结构和功能的理解。但目前传统测序方法中,现有的数据库仅提供了少量甚至不准确的蛋白质信息,对于有点突变或者未知修饰存在的话,由于搜库算法或者参数设置中没有考虑到,同样也无法得出正确的结果。随着从头测序技术和超高分辨率质谱测序仪的发展,这些传统质谱测序的局限都可能在De novo sequencing中被突破,从头测序采用高精准度质谱仪如Obitrap Fusion Lumos,全长测序,序列覆盖率达到100%;首位氨基酸测序准确率高达95%;样品用量低,蛋白样品仅需100μg,即可完成检测;一级二级质谱扫描速度快;可准确区分亮氨酸和异亮氨酸等。从头测序技术的灵敏度和准确度虽然高,但对一些痕量的蛋白质仍然难准确得到其氨基酸序列,此外测序技术的发展导致质谱仪价格非常昂贵。所以,需要积极地解决质谱自身发展的关键技术,才能使质谱在蛋白质分析中的作用更加的优化和凸显。

参考文献

[1]Edman P,Begg G.A protein sequenator[J].European Journal ofBiochemistry,1967,1(1):80-91.

[2]Tsugita A,Takamo to K,Kamo M.J.B iochem.,1992,206(3):691~696.

[3]Edman P.A method for the determination of amino acid sequence in peptides.Arch Biochem,1949,22(3):475.

[4]Schlack P,Kumpf W.Uber eine neue methode zur Ermittlung der konstitution von peptiden.Hoppe-Selier’s Z Physiol Chem,1926,154(1):125~170.

[5]莫碧兰,李江,梁宋平.蛋白质C端(异)硫氰酸法序列测定反应机理及进展[J].生物化学与生物物理进展,1999,(3):26-30.

[6]Stark G.B iochem istry,1968,7(9):1796~1807.

[7]Boyd V,BozziniM,Guga P.J.O rg.Chem.,1995,60(11):2581~2587.

[8]Anumula K,Tang S.FASEB J.,1995,9(6):1275.

[9]Mo BiLan,L i J iang,L iang SongPing.Progress in B iochem istry and B iophysics,1999,26(3):219~223.

[10]L i JunYong,L iang SongPing.Journal of N atural Science of Hunan N orm alUniversity,2001,24(3):67~72.

[11]陈文章.微流控芯片Edman降解及在蛋白质测序中的应用研究[D].浙江大学,2008.

[12]Bergman T,Cederlund E.Anal.Chem.,2001,290:74~82.

[13]高彦飞,王红霞.蛋白质及多肽C端测序的研究进展[J].分析化学,2007,(12):1820-1826.

[14]Zeng Rong,Xu LaiGeng,Xia QiChang.Acta B iochim ica et B iophysica S inica,1998,30(5):459~464.

[15]HarveyDJ.Identification of protein-bound carbohydrates by masss pectrometry[J].Proteomic,2001;1(2):311-328.

[16]Lay.JOJr.MALDI-TOF mass spectrometry of bacteria.[J].MassSpectromRev,2001;20(4):172-194.

[17]刘小琳,佟玲,郭欣,等.生物质谱技术在蛋白药物研究中的应用[C]//2012年中国药学大会暨第十二届中国药师周论文集,2012:3308-3313.

[18]Demirev PA,Ramirez J,Fenselau C.Tandem mass spectrometry of intact proteins for characteirzation of biomarkers from bacillus cereus T spores[J].Anal Chem,2001,73(23):5725‐5731.

[19]KARASM,HILLENKAMPF.Laser desorption ionization of proteins with molecular masses exceeding 10000 daltons[J].Anal.Chem,1988,60:2299-2301.

[20]Hebert AS,Richards AL,Bailey DJ,Ulbrich A,Coughlin EE,Westphall MS,Coon JJ.The one hour yeast proteome,Mol Cell Proteomics,2014,13:339–347.

[21]张于锰,陈语嫣,刘艳.电喷雾多级质谱研究功能小分子与蛋白质的非共价相互作用[J].大学化学,2021,36(X):1-7.

[22]周岳,杨湘云,黄敏,等.Orbitrap Exploris 480质谱在定量蛋白质组学应用中的优化和评测[J].生物化学与生物物理进展,2021,48(2):214-226.

[23]龚海霞,陈荣华,郭锡熔.蛋白质组技术及其在临床医学领域的运用[J].国外医学儿科学分册,2001,28(6):287-289.

[24]魏开华,杨松成,王红霞,等.转印到膜上的蛋白质的质谱分析.质谱学报,2000;20(3,4):89-90.

[25]司英健.蛋白质组学研究的内容、方法及意义[J].国外医学临床生物化学与检验学分册,2003,24(3):167-168.

[26]王征,阮幼冰,官阳.肝细胞癌患者血清蛋白质组成分的双向凝胶电泳-飞行时间质谱分析[J].中华病理学杂志,2003,32(4):333-336.

[27]黄珍玉,于雁灵,方彩云,等.质谱鉴定磷酸化蛋白研究进展[J].质谱学报,2003,24(4):494-500.

[28]邬江,朱家恺,许扬滨,等.许旺细胞源神经营养蛋白的质谱分析[J].中华显微外科杂志,2002,25(4):271-273.

作者简介:何先萍1990.04-),本科学历深圳市药品检验研究院(深圳市医疗器械检测中心)体外诊断试剂部