这个概念最早是在1995年提出的,它在本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识。 目前,在蛋白质功能方面的研究是极其缺乏的。大部分通过基因组测序而新发现的基因编码的蛋白质的功能都是未知的,而对那些已知功能的蛋白而言,它们的功能也大多是通过同源基因功能类推等方法推测出来的。有人预测,人类基因组编码的蛋白至少有一半是功能未知的。因此,在未来的几年内,随着至少30种生物的基因组测序工作的完成,人们研究的重点必将转到蛋白质功能方面,而蛋白质组的研究正可以完成这样的目标。在蛋白质组的具体应用方面,蛋白质在疾病中的重要作用使得蛋白质组学在人类疾病的研究中有着极为重要的价值。 疾病的产生可能仅仅是因为基因组中一个碱基对的变化,如β-血红蛋白第六位上的Glu变为Val就导致了镰刀型细胞贫血症的发生。然而,对于大多数疾病来说,其疾病发生机制要复杂的多。因此,对于疾病发生的分子机制的认识就需要一些能够解决这些复杂性的方法来完成。而作为细胞中的活性大分子,蛋白质无疑是与疾病相关的主要分子,蛋白表达水平的改变是与疾病,药物作用或毒素作用直接相关的。因此,基于蛋白质整体水平的蛋白质组学在人类疾病研究中无疑将发挥重要作用。 现在,蛋白质组学在人类疾病中的应用已经在一些疾病如皮肤病,癌症,心脏病中广泛开展了,而这些研究则主要集中在这样几个方面:寻找和疾病相关的单个蛋白,整体研究某种疾病引起的蛋白表达或修饰的变化,利用蛋白质组寻找一些致病微生物引起的疾病的诊断标记和疫苗等。下面,我们就将就蛋白质组学的基本技术和这些领域的应用作一些介绍。蛋白质组学研究的基本技术 对于蛋白质组学的研究来说,它的最基本的实验手段就是利用双向凝胶电泳(two-dimensional protein electrophoresis, 2DE),在整个 基因组水平上检测蛋白质表达的情况。双向凝胶电泳首先利用等电点聚焦来分离不同等电点的蛋白,再利用SDS-PAGE来分离不同分子量的蛋白,其分辨率是非常高的。微克级的蛋白质就可以被很好的分辨开了,如在微克级水平上,有人从一个蛋白混合物中最多分开了11200种蛋白质,数量是非常可观的。因而,微克级的蛋白的双向凝胶电泳常被用来初步检测表达或修饰有变化的蛋白。然后,同样的蛋白混合物样品可用于毫克级的2DE,这样,电泳图谱上的每一个多肽就可被纯化并进行下一步的分析,如质谱,末端或中间的氨基酸序列分析等。 仅仅进行双向凝胶电泳显然是远远不够的,因为由双向电泳得到的蛋白质表达情况的变化并不能和具体的何种蛋白表达出了变化联系起来。而一些如蛋白质印迹或凝集素亲和印迹等传统技术对于这方面的信息也帮助不大。为了鉴定这些由电泳得来的蛋白,质谱(MS,mass spectrometry)被广泛应用在蛋白质组学中。对于蛋白质的鉴定,有两种方法用的最为广泛,即MALDI-MS ( matrix-assisted laser desorption ionization)和ESI-MS (electrospray ionization)。这两种方法各有自己的 适用范围,通常前者对于分析高分子量的蛋白更有效,而后者对于蛋 白的检测灵敏度更高,常可达到飞克级水平以下。质谱可以用于蛋白质分析主要是因为它可以提供特定蛋白的不同方面的结构信息,如它可直接测定蛋白或多肽的分子量信息,也可用来获得一些蛋白质序列信息等。同时,质谱也可通过多肽片段分子量的改变来得到一些关于糖型,磷酸化和其它翻译后修饰的数据。因此,质谱对于蛋白质的鉴定是非常重要的,而它的进展也无疑会大大促进蛋白质组学的研究进展。单个的疾病相关蛋白的寻找 在疾病发生过程中,由于和疾病相关的遗传信息的变化常常会导致蛋白的种类和数量发生变化,而这些变化是可以被可以被高解析度的双向凝胶电泳所检测到的,这就是利用蛋白质组学寻找和鉴定疾病相关蛋白的依据。 结肠癌的产生是一个包含了多个基因突变的多步过程,这其中包括抑癌基因的功能丧失,癌基因的活化等。然而,肿瘤发生的具体机制仍不清楚。对于这样一种涉及多种蛋白的疾病,人们已经开始利用蛋白质组学来分析结肠粘膜发生恶性转化后的多肽的变化了。对照15例结肠癌病人和13例正常人的结肠表皮的双向凝胶电泳结果发现,二者分别含有882个和861个点,而这些点中,有一个蛋白,其分子量为 13kDa,等电点为5.6,它只在肿瘤组织中专一性的表达。在15个癌症样品中,有13例的此蛋白表达上调,占到了87%。进一步的研究也证实了这个蛋白在不同程度的癌症引起的发育异常中也有明显的表达水平上的差异。由双向电泳发现的这个可能与癌症相关的蛋白到底是什么蛋白呢?从电泳的凝胶上得到的这个点经胰蛋白酶水解后,得到的肽段由μ-HPLC分离后测序。测序的结果拿到两个序列,LGHPDTLNQ和VIEHMEDLDTNADK,这与钙粒蛋白B的情况完全吻合。进一步的用MALDI-MS分析的结果也证实了这个蛋白就是钙粒蛋白B。同时,结合以前的发现,即由钙粒蛋白B和A组成的异源二聚体蛋白钙防卫蛋白在胃肠肿瘤病人的粪便样品中含量有很大提高,钙粒蛋白B在肿瘤性转化的组织中的高专一性存在显示出它在结肠癌的产生中具有重要的作用。尽管蛋白的具体功能还需要进一步的阐明,但这个例子已经可以证明,由蛋白质组学方法寻找疾病相关蛋白肯定是可行的。 这方面的另一个例子是关于肝细胞癌的研究。双向凝胶电泳已经被成功的用于发现化学诱导的鼠的肝癌相关蛋白中。而双向电泳和蛋白质化学方法的联合应用也更深化了对这些癌症相关蛋白的具体特征的认识。在用N-甲基-N-亚硝基脲诱导了鼠的肝癌后,利用双向电泳发现了一些表达有变化的蛋白,经氨基酸序列分析后,分析其中一个蛋白是来源于肝癌的醛糖还原酶样蛋白( hepatoma-derived aldose reductase-like protein)。这个蛋白分子量为35KDa,等电点为7.4,它是 一种在肝癌和胚胎的肝中特异性表达的蛋白。利用双向电泳得到了这样一种可能和癌症相关的蛋白后,一些蛋白质化学的方法可用来对这种蛋白和疾病的相关性作进一步的研究。有人利用免疫组化的方法发现,直接针对来源于肝癌的醛糖还原酶样蛋白的抗体FR-1表明,这个蛋白在化学诱导的肝癌小鼠的发生肿瘤转化的前期和转化的早期就已经有很强的表达了,而正常肝组织中并无表达。这都是该蛋白涉及肝癌发生过程的有力证据。 已有的一些关于此蛋白的研究表明,醛糖还原酶是还原酶超家族的成员,在山梨糖醇途径中它可以催化葡萄糖向山梨糖醇的转化,而且在一些糖尿病的并发症的发生中它也有作用。作为一种酶,它可以水解一些生物异源物质等,因此它也参与了一些解毒过程。而在肝癌发生过程中,一些解毒酶的表达水平或活力增高已是公认的事实了。对于醛糖还原酶这一类有解毒功能的蛋白来说,只有由双向电泳发现的肝癌来源的醛糖还原酶样蛋白是与肝癌相关的。它首先在胚胎肝中表达,但在成年的肝中就不表达了。肝癌发生时,它又重新表达了。因此,目前可以初步推断,醛糖还原酶样蛋白在肝癌发生过程中是与肝的解毒过程相关的。现在,在人的肝癌中,也找到了鼠的醛糖还原酶样蛋白的同源蛋白,它同样是在人的不同组织中选择性表达的。疾病相关蛋白的整体研究 对于大多数疾病来说,疾病造成的往往不只一个或几个蛋白的变化,参与疾病过程的蛋白的数目也是很大的,因此除了通过双向凝胶电泳来寻找与疾病相关的单个蛋白外,通过蛋白质组对表达情况有变化的蛋白在整体水平上的研究同样是非常重要的。目前,在利用双向凝胶电泳进行的蛋白整体水平的研究方面,扩张性的心肌病(Dilated cardiomyopathy, DCM)是一个较好的例子。 扩张性的心肌病是一种严重的心脏疾病,对于这种疾病的致病机理和涉及的分子都还不清楚,而且,对于这样一种复杂的疾病来说,也不可能仅由一种致病机理造成。因此,对于这样的疾病,从整体的蛋白质组水平来研究是极为必要的。另外,相对其它组织而言,主要由心肌细胞组成的心脏是一种相对均一的组织,这也为用双向凝胶电泳进行蛋白质组的研究提供了良好的基础。对DCM的蛋白质组的研究在九十年代初就已经开始了,目前,心肌的双向凝胶电泳的数据库已经建立。尽管国际上各实验室之间的数据之间有着如不同的样品制备,不同的等电聚焦条件,不同的凝胶大小等差异,但这些数据的比较证明,在大多数情况下,不同蛋白的点的位置还是相对稳定的,可以进行大规模的比较研究。 在Knecht等人的研究中,得到了一个高解析度的具有大约3300个心肌蛋白点的双向电泳结果,并对其中的150个蛋白进行了氨基酸分析,N端和中间的Edman降解以及MALDI-MS等一系列鉴定。而对几百个正常和扩张性心肌病的病人的2-DE结果比较发现,两者的蛋白条带具有可比性。除去一些可能由不同的疾病有关参数如患病程度,用药情况,病人年纪等因素造成的无重复性的点的多少和强度的变化外,患病者和正常人有25种蛋白在统计学上具有显著差异。这些即是DCM相关蛋白。而这个结果是在对几百个样品的大规模研究的基础上得来的,而也只有大规模的研究,才能体现出这个结果在实际应用前景上的价值。对于这几十种疾病相关蛋白,我们可以用一些其它方法,如免疫组化,酶活测定等,来作进一步的鉴定,确认它们与疾病的相关性以及它们在疾病中的作用等。这些工作都是在基于蛋白质组的研究基础上进一步的深入而进行的,显然,在几百个DCM患者和正常对照的样品的大规模水平上对疾病相关蛋白的整体研究无疑是最为基础和有效的。病原微生物的蛋白质组学分析 近几年来,关于传染病的研究变得比原来更为重要。一些新的传染原,如Borrelia burgdorferi,HIV,Ebola病毒等的出现,使得一些原来认为已被控制的疾病如结核,多抗药性的链球菌属感染等又有所增 加。因此,对于有毒力的微生物和病毒进行蛋白质组学的分析就显得非常必要,它可以用来寻找和研究毒力因子,抗原,疫苗等,而这些对于疾病的诊断,治疗和防治是极为重要的。目前,已经有18种微生物的基因组测序已经完成,而另有60多种的微生物的基因组测序正在进行当中,这些基因序列的信息和相对真核组织来说少得多的基因数量都为蛋白质组的研究提供了良好的基础。 疏螺旋体属的Borrelia burgdoferi是引起多系统疾病人类Lyme氏疏 螺旋体病的主要致病因子。这种疾病的症状开始时常表现为一些环状红斑样皮疹以及流感样症状,发展下去也会造成一些神经系统的并发症和关节炎等。目前,对这种疾病的诊断主要是通过临床症状的判断并辅以血清学实验如ELISA,免疫印迹等来证实。由于这些实验具有不同程度的敏感性和特异性,诊断并不是标准化的。利用蛋白质组学的研究提供一些新的较为标准的诊断标记就显得尤为必要了。 Borrelia burgdoferi的染色体上有853个基因,它的11个质粒上有额 外的430个基因。它的双向凝胶电泳图谱大约有300个点,由这些蛋白点就可以寻找免疫相关抗体等蛋白了。将银染的 Borrelia burgdoferi的 2DE凝胶上的其中217个点编号后,用来源于兔子的多克隆抗体采用免 疫杂交的方法鉴定了一些抗原在胶上的位置,如外表面蛋白A(OspA),OspB,OspC,p83/100,p39,flagellin p41等。除了p83/100外,所有 抗原在2DE图上都存在于不只一个点上。利用不同表现症状的Lyme氏 疏螺旋体病病人的血清与疏螺旋体的2DE图进行印迹分析发现,具有 红斑迁移症状的十个病人的血清中分别含有60种和88种抗原的IgM型和IgG型抗体,而关节炎病人的血清中含有15种抗原的IgM抗体和76种不同抗原的IgG抗体,晚期神经疏螺旋体病人的血清中则含有33种抗原的IgM抗体和76种抗原的IgG抗体,但在这三种不同疾病时期的病人血清中都含有这样几种抗原的抗体,OspA,OspB,OspC,flagellin,p83/100,p39等,这几个抗原同时也是原来血清学实验中用来诊断的标记,蛋白质组的结果验证了原来诊断的合理性,同时,2DE的结果也发现了一些原来并没有发现的抗原,这些正是一些新的潜在的诊断标记。更多诊断标记的发现对于诊断的标准化和准确性的提高大有帮助。 弓形虫病是由原生动物Toxoplasma gondil寄生感染引起的,全世 界约有30%的人携带此种寄生虫,而在欧洲,弓形虫病是发生频率最 高的传染病之一,因此,这种疾病的危害是相当高的。在健康人群中,寄生虫的感染通常是无症状的或症状极其轻微的,但如果是怀孕期间感染,寄生虫就会通过胎盘,并造成胎儿的死亡。随着怀孕时间的增加,寄生虫穿透的可能性也会增加。因此,确定感染的时间就显得非常重要了。另一方面,怀孕不同时期的感染后果也是不同的,在怀孕早期,器官形成过程时的感染危害可能是致死的,而怀孕的后期,胎儿的感染经常会导致一些并发症的出现如视网膜色素异常等。如果在怀孕期间感染的妇女得到了充分的治疗,胎儿感染的可能和后果的严重性都会大大降低。因此,及时的诊断和准确判断感染时间对于弓形虫病的治疗是非常重要的。 但实际上,90%以上的怀孕妇女的初期感染都不能被及时发现。目前的诊断主要是依靠血清学手段和PCR方法,而用血清学的方法来检测抗体对于一些无免疫应答的和怀孕的病人显然是不够的,而潜伏性感染致病恰恰是经常发生在无免疫应答的人中。如在艾滋病患者中, T.gondil就是导致脑内病变并致死的主要原因。由这些都可看出,疾病的有效的诊断对于有效的治疗是非常关键的。同样,蛋白质组水平上的研究为这方面的进展提供了非常有力的方法。我们可以用不同感染情况的病人的血清和T.gondil的2DE图进行免疫印迹来寻找和感染相关的抗 原来作为诊断标记。这些不同的血清包括:急性感染弓形虫病的 怀孕妇女的血清,急性弓形虫病的非怀孕病人的血清,潜伏性感染弓形虫的尚未发病者的血清。结果显示,2DE图上的9个点可以和感染者血清中的任一类型的免疫球蛋白反应,且这种反应和感染的状态和发病与否无关,这9个点就可用来作为T.gondil 感染的标记。另外有7个点 和抗体的反 应则与抗体类型或发病情况有关,可用来区分不同疾病状 况如潜伏期和急性期等,它们同样可作为进一步判断感染状态的诊断标记使用。小结 双向凝胶电泳就象一个分子显微镜,将复杂的蛋白混合物分离开来,而进一步的由疾病和对照的比较可以找到一些疾病相关蛋白。目前,蛋白质组的应用最多的领域就是通过疾病和对照的2DE条带的比较寻找单个的疾病相关蛋白,钙粒蛋白B在结肠癌中的表达上调和肝癌来源的醛糖还原酶样蛋白在鼠的肝癌发生过程中的重新表达就是两个典型的例子。这些蛋白和疾病的相互关系还可以通过免疫组化等方法进一步的鉴定。而另一方面,利用蛋白质组来进行整体水平上的研究也是不可缺少的。如对扩张性心肌病的研究就显示出了患病者和对照的 25种蛋白的显著差异,人的心肌的包括了3300个蛋白的双向凝胶电泳数据库也已经建立了。对于整体水平上的研究而言,规模越大,使用样品数目越多,对分子机制的研究可能就越深入,因而国际间的协作是非常重要的。蛋白质组学应用的另一领域是在致病微生物的诊断用蛋白的寻找方面,如在上面所提到的Borrelia burgdoferi引起的Lyme氏 疏螺旋体病和Toxoplasma gondil引起的弓形虫病等,由蛋白质组学得 来的诊断标记甚至还可用来区分不同的疾病时期,这些都为有效的 诊断检测的发展提供了基础。蛋白质组学的研究在蛋白质功能和人类疾病研究方面为我们开辟了一个新的领域,尽管它还处于刚刚起步的不成熟期,很多技术还有待完善和发展,但它的潜力是不可低估的,在将来,蛋白质组在人类疾病中的应用也必然会更加广泛和深入。