|
|
| |
| 3'end
processing sequence analysis |
|
根据聚类分析结果(图1)和碱基频率分布统计结果(图1), 给出了水稻pre-mRNA 3'端顺式作用元件分布的结构模型(图1)。这个结构的核心部分包括Poly(A+)位点以及附近的T-rich元件、NUE、
FUE和DSE。Poly(A+)位点是一个二聚核苷酸序列YA,其上游区域一般富含T,某些序列的下游也存在富含T区域,相应序列组成的保守性比上游的富T区域高。NUE的核心区域位于Poly(A+)位点上游20~30
nt处,其组成富含A,T,可分成分别以AATAAA和TATATA为代表的两类。FUE一般位于Poly(A+)位点上游50~70
nt处,其组成以"TGTA"为核心,也可能是富T/GT字符串。在某些序列的Poly(A+)位下游,存在富T/GT的DSE。作为补充,在某些mRNA中,Poly(A+)位点下游出现若干个连续的A
(图1中未标出)。
 |
图13. 水稻mRNA 3'末端加工相关元件的总体结构.
Fig.13. The general structure of mRNA 3'end processing
related element in rice.
|
植物mRNA 3'端处理的相关顺式作用元件的分散性、多样性以及复杂性特点导致一些元件难以从统计分析获得,本文给出的是有统计学显著意义的元件,可作为对单基因研究的补充和提示。图13中的结构仅仅是依据本文的数据而提出的一个模型,涵盖了Graber
和Zhao提出的模型(Graber et al., 1999 ; Zhao et al., 1999)和部分单基因研究的成果。在特定mRNA中往往只存在这个模型中的部分元件的组合,如只有一部分植物mRNA需要下游区作为辅助因子,另外在不少序列的Poly(A+)位点两侧没有富T区域。就元件保守性而言,同类元件虽都有一定的相似性,但没有一个类型的元件存在很高的保守性,这表明水稻基因同其他植物一样,缺乏高度保守的Poly(A+)加工相关顺式作用元件。
这种推论的依据和含义是:
一、 从碱基分布状况角度而言,在-150~+100的区间内无论是转录本序列还是延伸的基因组序列其碱基比例依次为:T>A>G>>C,其比例相对恒定,其中(A+T)%大于60%。碱基序列的高比例(G+C)是维持稳定二级结构所必须,因为氢键是形成mRNA二级结构的主因,提示出Poly(A+)位点周围序列不易形成二级结构。
二、 从字符串的分布角度而言,在近Poly(A+)位点两端分别存在T-rich元件,提示出这个区域更趋向于保持一级结构状态。
三、 在Poly(A+)位点下游区域的+10 到 +30区段存在着DSE区域,该GT/T富含序列的存在提示出植物mRNA可能也存在着稳定3'末端加工复合物的辅助元件。这种辅助元件的不保守性和宽范围分布,体现出加工复合物对DSE的识别是非严谨的。
四、 就元件保守性而言,同类元件虽都有一定的相似性,但没有一个类型的元件存在很高的保守性,说明多剪接方式在植物pre-mRNA的转录后加工过程中普遍存在。
五、 同一基因高冗余度的EST簇的分析结果显示,植物mRNA 3' 末端加工具分散性和多样性,同一个基因不同的成熟mRNA
其3'UTR长度不一,存在多个Poly(A+)位点和相应的顺式作用元件,说明加工复合物可以在pre-mRNA 3'端多个区域形成核酸蛋白复合物。值得注意的是,不同区域的Poly(A+)位点成簇出现。意味着在一个区域中,稳定结合的加工复合物可以在相邻的不同位点剪接。
六、 稳定结合的加工复合物的位置由3'UTR的FUE和NUE决定,同类元件虽都有一定的相似性,但没有一个类型的元件存在很高的保守性,暗示出植物中也许存在着多种加工复合物。
与现有植物pre-mRNA3'末端的顺反式元件互作模型不同,在这个推测中,植物存在着DSE元件,该元件的作用是与CPSF因子结合,有助于CFs的定位和剪切,虽然这种结合是一种非严谨的识别,但恰恰是DSE元件的不保守性和宽范围分布可以用来解释Poly(A+)位点的成簇现象和为什么成熟mRNA
3'端长度存在着多样性。近Poly(A+)位点两端的序列不形成二级结构,而是以类似于"环"的结构存在,"环"的大小决定了剪接位点的位置。所检测到的DSE元件多为GT/T富含序列,这样"环"中DSE元件不会对"环"的稳定性产生影响。植物中不存在典型的DSE元件的机制是否是成熟mRNA3'端多样性的序列基础,NUE和FUE序列的非保守性是否真正代表存在着多种加工复合物,需进一步实验证实。 |
|