EST | Array | Services | Bio-Links | Software | Books | Contact | About us
Email Address

Password

Home
 
EST
·Introduction
·EST analysis
·3'end Analysis
·Navigation
·Reference
·Search
·Supply Data
 
Array
·Introduction
·Navigation
·Search
·Supply Data
 
Services
·Querying Clones
 
Bio-Links
 
Software
·DNAuser
·Pusamen
 
Books
·Practical Protocols of Gene Engineering
·Basic knowledge of rice
 
摘要


  通过选择3'EST测序方式,完成了一个具25170条水稻含Poly(A+)尾EST数据库的构建,数据库按不同文库的背景分成三个子集:叶文库、胚乳库和茎文库子集,各自包含13316、9369 和 2485条具Poly(A+)尾的EST。序列的基本统计结果显示,不同文库测序结果所获具Poly(A+)序列的百分比不同。基因表达的组织特异性差异是造成文库间TUT比例极不均一的主要原因,其中茎文库子集TUT比例高达76.6%。已定位的TUT在各个染色体上的分布极不均匀,说明了基因在染色体分布的不均一性客观存在。一些TUT定位于多个染色体上,表明基因多拷贝现象普遍存在。相当大一部分EST是第一次被检测得到。各个文库中EST冗余度的分布情况是,大部分基因为低水平表达,少部分基因为高丰度表达。由于文库来自于不同的组织和生命过程,表达基因的种类有很大的不同,绝大部分共表达基因其冗余度也大相径庭,反映出不同背景文库的表达谱特征。胚乳文库含较高丰度的表达基因主要是与贮藏蛋白的编码、淀粉的合成、光呼吸等生化过程有关,中高丰度表达基因中相当一部分(35%)为功能未知,推测这些基因的功能可能与胚乳的生理特征相关。叶文库中20.1%的中、高丰度TUT占EST总量的58.5%,并且多达60%以上的EST是未知功能基因,两大类基因的表达丰度较高,一类是水稻叶片组织特异性相关基因,主要是参与植物光合作用相关的基因;另一类是水稻受外界胁迫表达的抗逆相关基因,涉及植物抗逆过程的已知功能蛋白达66类,包含171类TUT,共993条EST。在茎EST数据集中有两类基因值得重点关注:一类是与信号传导相关的基因,仅具备相应功能注释的相关EST就达8.3%;另一类是植物特有的转录因子如乙烯应答因子结合蛋白等,其种类和数量占相当比例。

  基于3'EST数据集的非编码区特征分析,本文给出了水稻mRNA Poly(A+) 位点周围3'末端加工相关顺式作用元件分布的总体结构模型。这个结构的核心部分包括Poly(A+)位点以及附近的T-rich、NUE、 FUE和DSE区域。Poly(A+)位点是一个二聚核苷酸序列YA,其上游区域一般富含T,某些序列的下游也富含T,相应序列组成的保守性比上游的富T区域高。NUE的核心区域位于Poly(A+)位点上游20~30 nt处,其组成富含A,T,可分成以AATAAA和TATATA为代表的两类。其中,AATAAA一般被认为是典型的位置元件,起决定下游Poly(A+)剪接位点的作用。TATATA类元件在酵母的类似研究中被鉴定为效率因子,位置在NUE区域上游20~30 nt处,但本文的统计表明该类元件与典型的NUE元件分布相似,准确的功能还需进一步研究。FUE位于Poly(A+)位点上游50~70 nt处,其组成以"TGTA"为核心,也可以是富T/GT字符串。在某些序列的Poly(A+)位下游,存在富T/GT的DSE元件,作用可能与稳定加工复合物有关。作为补充,在某些mRNA中,Poly(A+)位点下游可能会出现若干个连续的A。最后,本文提出了一种推论,这种推论为明确顺式作用元件与反式作用元件互作机制提供了一种模式。