- 陶小凡
-
什么是基因表达模式分析
说白了就是分析基因如何表达的。基因表达模式,就是从DNA到蛋白质的过程,这个过程是如何进行的就是它的模式。
什么是基因表达的系列分析?
基因表达系列分析
1995年Velculescu等提出了基因表达系列分析(Serial Analysis of Gene
Expression,SAGE)技术,能同时对上千个转录物进行研究。
1. SAGE的原理和实验路线。
1.1 SAGE的原理
SAGE的主要依据有两个。第一,一个9~10碱基的短核苷酸序列标签包含有足够的资讯,能够唯一确认一种转录物。例如,一个9碱基顺序能够分辨262144个不同的转录物(49),而人类基因组估计仅能编码80000种转录物,所以理论上每一个9碱基标签能够代表一种转录物的特征序列。第二,如果能将9碱基的标签集中于一个克隆中进行测序,并将得到的短序列核苷酸顺序以连续的资料形式输入计算机中进行处理,就能对数以千计的mRNA转录物进行分析。
1.2 SAGE的实验路线。
如图1所示:(1) 以biotinylated oligo(dT)为引物反转录合成cDNA,以一种限制性内切酶(锚定酶
Anchoring Enzyme,
AE)酶切。锚定酶要求至少在每一种转录物上有一个酶切位点,一般4碱基限制性内切酶能达到这种要求,因为大多数mRNA要长于256碱基(44)。通过链霉抗生物素蛋白珠收集cDNA3′端部分。对每一个mRNA只收集其polyA尾与最近的酶切位点之间的片段。(2)
将cDNA等分为A和B两部分,分别连线接头A或接头B。每一种接头都含有标签酶(Tagging Enzyme
TE)酶切位点序列(标签酶是一种Ⅱ类限制酶,它能在距识别位点约20碱基的位置切割DNA双链)。接头的结构为引物A/B序列+标签酶识别位点+锚定酶识别位点。(3)
用标签酶酶切产生连有接头的短cDNA片段(约9~10碱基),混合并连线两个cDNA池的短cDNA片段,构成双标签后,以引物A和B扩增。(4)
用锚定酶切割扩增产物,抽提双标签(Ditga)片段并克隆、测序。一般每一个克隆最少有10个标签序列,克隆的标签数处于10~50之间。(5)
对标签资料进行处理。在所测序列中的每个标签间以锚定酶序列间隔,如图1中锚定酶采用Nia
Ⅲ限制性内切酶,则以CATG/GTAC序列确定标签的起始位置和方向。
图1 基因表达系列分析(SAGE)示意
锚定酶(AE)和标签酶(TE)是NiaⅢ、FokI
X和O分别表示不同标签的核苷酸顺序
由于双标签体的长度基本相同,不会导致扩增的偏态性,同时数量和种类极大的转录物使同一种标签连线成双标签体的可能性极小,这保证了克隆中的每一个标签代表一种转录物在当前细胞状态下的一个单位的转录产物,因此通过计算机软体的分析能够得到上千种基因表达产物的标签序列以及丰裕度。
虽然SAGE技术能够尽可能全面地收集生物组织的基因表达资讯,但也不能完全保证涵盖所有的低丰度的mRNA。另外标签体的连线可能因接头的干扰造成克隆所包含的标签体过少和克隆序列末端不能高效地连入载体。Powell利用磁性生物素珠特异吸附引物,避免了接头的干扰(Powell
1998)。
2. SAGE的优点和应用
SAGE是一项快捷、有效的基因表达研究技术,任何具备PCR和手动测序器具的实验室都能使用这项技术,结合自动测序技术能够在3个小时内完成1000个转录物的分析。另外使用不同的锚定酶(识别5~20碱基的Ⅱ类核酸内切酶),使这项技术更具灵活性。
首先SAGE可应用于人类基因组研究。1995年 Velculescu 等选择B *** F I和Nia
Ⅲ分别作为标签酶和锚定酶,使用计算机对9碱基标签资料进行分析并对GenBank检索。在分析的1000个标签中,95%以上的标签能够代表唯一的转录物。转录水平依标签出现频率分为4类:①
超过三次 共380个,占45.2%;② 出现三次 共45个,占5.4%;③ 出现两次
共351个,占7.6%;④ 仅出现过一次
共840个,占41.8%。所以SAGE能够快速、全范围提取生物体基因表达资讯,对已知基因进行量化分析。SAGE也能应用于寻找新基因。虽然SAGE的标签仅包括9个碱基,但加上锚定酶的位点序列(4个碱基)共可确认13碱基序列。如果一个标签检索已知序列时没有同源序列,13碱基片段就可作为探针筛选cDNA文库得到cDNA克隆。
其次,SAGE可用于定量比较不同状态下的组织细胞的特异基因表达。Stephen
L等(1997)利用SAGE技术比较小鼠胚囊纤维细胞基因表达。小鼠胚囊纤维细胞能产生对温度敏感的P53肿瘤抑制蛋白,就可通过SAGE分析,比较两种不同温度下基因表达的差异。从约15
000个分析的基因中,发现有14个基因的表达依赖于P53蛋白,有3个基因的表达与P53蛋白的失活显著相关。Zhang等(1997)比较正常细胞和肿瘤细胞基因表达的300000个转录物发现:在分析的4500种转录物中,至少有500种在两种细胞组织中的表达有显著差异。
第三,由于SAGE能够同时最大限度的收集一种基因组的基因表达资讯,转录物的分析资料可用来构建染色体表达图谱(Chromosomal
expression
map)。Victor等分析了酵母基因组的基因表达,从60633个转录物中发现了4655个基因(表达水平分布在0.3~2.0/细胞),其中1981个基因已被确认了功能,2684个还未被报道过。利用基因的表达资讯与基因组图谱融合绘制的染色体表达图谱,使基因表达与物理结构连系起来,更利于基因表达模式的研究。(Velculescu,1997)
SAGE是基因表达定性和定量研究的一种有效工具,非常适合于比较不同发育状态或疾病状态的生物基因表达。另外SAGE能够接近完整地获得基因组表达资讯,能够直接读出任何一种型别细胞或组织的基因表达资讯。SAGE技术的应用将大大加快基因组研究的进展,但必须和其它技术相互融合、互为补充,才能最大可能地进行基因组基因表达的全面研究。
什么是基因表达?
是指生物体将一个基因所携带的遗传资讯转变为具有生物性的多肽链的过程。
基因表达 基因表达(gene expression)是指细胞在生命过程中,把储存在DNA顺序中遗传资讯经过转录和翻译,转变成具有生物活性的蛋白质分子.生物体内的各种功能蛋白质和酶都是同相应的结构基因编码的。
1.转录过程
在RNA聚合酶的催化下,以DNA为模板合成mRNA的过程称为转录(transcription).在双链DNA中,作为转录模板的链称为模板链(template strand),或反义链(antisensestrand);而不作为转录模板的链称为编码链(coding strand),或有义链(sense strand).在双链DNA中与转录模板互补的一条DNA链即编码链,它与转录产物的差异仅在于DNA中T变为RNA中的U.在含许多基因的DNA双链中,每个基因的模板链并不总是在同一条链上,亦即一条链可作为某些基因的模板链的,也可是另外一些基因的编码链。
转录后要进行加工,转录后的加工包括:
(1)剪接:一个基因的外显子和内含子都转录在一条原始转录物RNA分子中,称为前mRNA(pre-mRNA),又称核内异质RNA(heterogenuous nuclear RNA,huRNA)。因此前mRNA分子既有外显子顺序又有内含子顺序,另外还包括编码区前面及后面非翻译顺序。这些内含子顺序必须除支而把外显子顺序连线起来,才能产生成熟的有功能的mRNA分子,这个过程称为RNA剪接(RNa splicing)。剪下发生在外显子的3"末端的GT和内含子3"末端与下一个外显子交界的AG处。
(2)加帽:几乎全部的真核 mRNa 端都具“帽子”结构。虽然真核生物的mRNA的转录以嘌呤核苷酸三磷酸(pppAG或pppG)领头,但在5"端的一个核苷酸总是7-甲基鸟核苷三磷酸(m7GpppAGpNp)。mNRA5"端的这种结构称为帽子(cap)。不同真核生物的mRNA具有不同的帽子。
mRNA的帽结构功能:①能被核糖体小亚基识别,促使mRNA和核糖体的结合;②m7Gppp结构能有效地封闭RNa 5"末端,以保护mRNA免疫5"核酸外切酶的降解,增强mRNA的稳定
(3)加尾:大多数真核生物的mRNA 3"末端都有由100~200个A组成的Poly(A)尾巴。Poly(A)尾不是由DNA编码的,而是转录后的前mRNA以ATP为前体,由RNA末端腺苷酸转移酶,即Ploy(A)聚合酶催化聚合到3"末端。加尾并非加在转录终止的3"末端,而是在转录产物的3"末端,由一个特异性酶识别切点上游方向13~20碱基的加尾识别讯号AAUAAA以及切点下游的保守顺序GUGUGUG,把切点下游的一段切除,然后再由Poly(A)聚合酶催化,加上Poly(A)尾巴,如果这一识别讯号发生突变,则切除作用和多聚腺苷酸化作用均显著降低。mRNAPoly(A)尾的功能是:①可能有助mRNA从核到细胞质转运;②避免在细胞中受到核酶降解,增强mRNA的稳定性。
2.翻译过程真核细胞的转录以及加工都是细胞核内进行,但翻译过程则在细胞质中进行。
以mRNA作为模板,tRNA作为运载工具,在有关酶、辅助因子和能量的作用下将活化的氨基酸在核糖体(亦称核蛋白体)上装配为蛋白质多肽链的过程,称为翻译(translation),这一过程大致可分为3个阶段:
(1)肽链的起始:在许多起始因子的作用下,首先是核糖体的小亚基和mRNA上的起始密码子结合,然后甲酰甲硫氨酰tRNA(tRNA fMet)结合上去,构成起始复合物。通过tRNA的反密码子UAC,识别mRNA上的起始密码子AUG,并相互配对,随后核糖体大亚基结合到小亚基上去,形成稳定的复合体,从而完成了起始的作用。
(2)肽链的延和长:核糖体上有两个结合点——P位和A位,可以同时结合两个氨酰tRNA。当核糖体沿着mRNA从5"→3"移动时,便依次读出密码子。首先是tRNAfMet结合在P位,随后第二个氨酰tRNA进入A位。此时,在肽基转移酶的催化下,P位和A位上的2个氨基酸之间形成肽键。第一个tRNA失去了所携带的氨基酸而从P位脱落,P位空载。A位上的氨酰tRNA在移位酶和GTP的作用下,移到P位,A位则空载。核糖体沿mRNA 5"端向3"端移动一个密码子的距离。第三个氨酰tRNA进入A位,与P位上氨基酸再形成肽键,并接受P位上的肽链,P位上tRNA释放,A位上肽链又移到P位,如此反复进行,肽链不断延长,直到mRNA的终止密码出现时,没有一个氨酰tRNA可与它结合,于是肽链延长终止。
(3)肽链的终止:终止讯号是mRNA上的终止密码子(UAA、UAG或UGA)。当核糖体沿着mRNA移动时,多肽链不断延长,到A位上出现终止讯号后,就不再有任何氨酰tRNA接上去,多肽链的合成就进入终止阶段。在释放因子的作用下,肽酰tRNA的的酯键分开,于是完整的多肽链和核糖体的大亚基便释放出来,然后小亚基也脱离mRNA。
(4)翻译后加工(postranslational processing):从核糖体上释放出来的多肽需要进一步加工修饰才能形成具有生物活性的蛋白质。翻译后的肽链加工包括肽链切断,某些氨基酸的羟基化、磷酸化、乙酰化、糖基化等。真核生物在新生手肽链翻译后将甲硫氨酸裂解掉。有一类基因的翻译产物前体含有多种氨基酸顺序,可以切断为不同的蛋白质或肽,称为多蛋白质(polyprotein)。例如胰岛素(insulin)是先合成86个氨基酸的初级翻译产物,称为胰岛素原(proinsulin),胰岛素原包括A、B、C三段,经过加工,切去其中无活性的C肽段,并在A肽和B肽之间形成二硫键,这样才得到由51个氨基酸组成的有活性的胰岛素。
3.外显子与内含子表达过程中的相对性 从内含子与外显子的定义来看,两者是不能混淆的,但是真核生物的外显子也并非都“显”(编码氨基酸),除了tRNA基因和rRNA基因的外显子完全“不显”之外,几乎全部的结构基因的首尾两外显子都只有部分核苷酸顺序编码氨基酸,还有完全不编码基酸的外显子,如人类G6PD基因的第一外显子核苷酸顺序。
现在已发现一个基因的外显子可以是另一基因的内含子,反之亦然。以小鼠的淀粉酶基因为例,来源于肝的与来源于唾液腺的是同一基因。淀粉酶基因包括4个外显子,肝生成的淀粉酶不保留外显子1,而唾液腺中的淀粉酶则保留了外显子1的50bp顺序,但把外显子2与前后两段内含子一起剪下掉,经过这样剪接,外显子2就变成唾液淀粉酶基因中的内含子。
4.同一基因在不同组织能生成不同的基因产物 来源于不同组织的类似蛋白,可以由同一基因编码产生,这种现象首先是由于基因中的增强子等有组织特异性,它能与不同组织中的组织特异因子结合,故在不同组织中同一基因会产生不同的转录物与转录后加工作用。此外真核生物基因可有一个以一的poly(A)位点,因此能在不同的细胞中产生具有不同3"末端的前mRNA,从而会有不同的剪接方式。由于大多数真核生物基因的转录物是先加poly(A)尾巴,然后再行剪接,因此不同组织、细胞中会有不同的因子干预多聚腺苷酸化作用,最后影响剪接模式。
基因表达就是转录和翻译.转录发生在细胞核中,翻译发生在细胞质中的核糖体上.
基因表达是指细胞在生命过程中,把储存在DNA顺序中遗传资讯经过转录和翻译,转变成具有生物活性的蛋白质分子。
基因表达是指细胞在生命过程中,把储存在DNA顺序中遗传资讯经过转录和翻译,转变成具有生物活性的蛋白质分子。生物体内的各种功能蛋白质和酶都是同相应的结构基因编码的。
基因表达包含转录(DNA到RNA)和翻译(RNA到蛋白质)两步。
基因表达是指细胞在生命过程中,把储存在DNA顺序中遗传资讯经过转录和翻译,转变成具有生物活性的蛋白质分子。生物体内的各种功能蛋白质和酶都是同相应的结构基因编码的。
全基因组基因表达分析包括lncrna吗
因此,lncRNA未来能否作为分子靶标成功应用于临床诊断和癌症治疗、细胞分化及发育等密切相关;
应急功能,尤其是与衰老相关的疾病有密切关系,例如心血管疾病、阿尔兹海默症:LncRNA可作为细胞内各种讯号招募蛋白形成复合物参与免疫反应和宿主防御。
LncRNA与疾病:LncRNA与人类的许多疾病LncRNA在生物体内的功能主要分为三大类:
生物学功能:LncRNA与表观遗传调控、转录调控,不像mRNA的翻译需要严格按照三联体密码子的使用法则一样,单个密码子的移码突变就会导致蛋白功能的丧失,lncRNA的保守区段可能仅在一段较短的区域内,这些较短区域对于结构或序列特异性相互作用较为关键、转录后调控、癌症等、miRNA调控:在lncRNA的基因组序列两端各设计1个gRNA,致使整个lncRNA区段或大部分片段序列缺失,从而实现lncRNA的敲除。
由于大多数长链非编码RNA在物种之间没有明显的序列保守性,对lncRNA进行碱基替换、插入或缺失部分序列时仍能表现出其原有的生物学活性。
技术原理
LncRNA敲除原理。因此lncRNA功能的缺失需要通过删除这段保守的区域来完成,将是其日后发展的难点与热点、糖尿病
基因表达分析与基因组测序与什么联络
基因表达分析是看表达量的,基因组测序是看基因组的突变情况,有无缺失,突变等,一个是定量的一个是定性的,可以理解为