登录| 注册    
收藏  点赞 

DNA重复序列

基因组DNA中重复出现的核苷酸序列。除了单细胞的酵母以外,几乎所有的真核生物基因组DNA中,都具有重复序列,而且在有些例子中重复序列的拷贝数可高达百万份以上。在人的DNA中,至少具有20份拷贝的重复序列的DNA,占总DNA的30%左右。

基因组DNA中重复出现的核苷酸序列。除了单细胞的酵母以外,几乎所有的真核生物基因组DNA中,都具有重复序列,而且在有些例子中重复序列的拷贝数可高达百万份以上。在人的DNA中,至少具有20份拷贝的重复序列的DNA,占总DNA的30%左右。

在真核基因组中存在有四种不同类型的DNA序列:①不重复的序列,只有一个拷贝;②低度重复序列,有1到100个拷贝;③中度重复序列,有100到几万个拷贝;④高度重复序列,有几万到几百万个拷贝。通常研究的都是二倍体的细胞,因此一种不重复的唯一序列实际上存在着两个拷贝。在真核生物中约有70%的基因是单拷贝的。许多种重要的蛋白质,例如丝心蛋白及卵清蛋白等,都是由单拷贝基因编码的。这种不重复的序列,通常只有1000BP(碱基对)左右,所占的DNA的百分比也较低。低度重复序列的基因只有少数的拷贝数。有些例子中,这些重复序列其实并非完全重复,因此基因产物之间,在氨基酸的组份上就会有些差异。例如血红蛋白基因,能产生具有不同氨基酸组份的血红蛋白

中度重复序列有两种:一种是成簇的重复序列,另一种是分散的重复序列。成簇的重复序列通常代表多拷贝的基因。例如海胆的组蛋白基因簇,是由五种主要的组蛋白基因(H1,H2A,H2B、H3、H4)集结在一起,组成长度为7kb(kb=1000碱基)的重复单位(见图)。这些可重复单位在不同生物的基因组上,可串联地重复出现数百份乃至上千份的拷贝,以增加其基因产物的合成速率和数量。分散的重复序列的长度因不同的物种而有差异,变动的范围为130~300BP之间,每一个基因组中这种分散的重复序列的拷贝数可达数千份之多。例如哺乳动物中最丰富的Alu分散重复序列簇(含有限制酶AluI的识别位点…GACT…而得名),每个基因组甚至可高达约300000份拷贝。在整个基因组中,包括在间隔区和间隔子内,都可以找到Alu序列。重复序列簇的新成员,很可能是由Alu序列的RNA分子逆转录产生的cDNA重复插入到基因组上所形成的。

海胆和果蝇组蛋白基因簇示意图

高度重复序列包括卫星DNA中的短序列和一些大量存在的基因的正常序列,例如,rRNA基因可多达数百份。这类rRNA基因有两方面突出的特点:其一,这些基因是串联重复的,几乎所有真核生物的rRNA基因的拷贝数都超过100份。其二,大部分的rRNA基因,都是位于染色体中同核仁结合的特殊部位。已知在卵母细胞中,编码rRNA分子的基因几乎占总DNA的75%。生物体以rRNA基因和组蛋白基因这种多拷贝的形式,增加基因的剂量,提高蛋白质合成的速率和效率,这可能是一种特例并非普遍的模式。因为已经知道,许多重要的蛋白质都是由单拷贝基因编码的。例如,丝心蛋白的单拷贝基因,能够合成高达104mRNA分子,合成后的数天内仍是稳定的,而每个mRNA分子又可合成105左右的蛋白质分子的模板。因此,一个单拷贝的基因,在四天内就可合成109蛋白质分子。单拷贝基因这种高度的表达能力,对于基因操作无疑是极为有用的。