

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、棉花作為纖維的重要來源,是一種重要的經(jīng)濟作物,在世界經(jīng)濟中發(fā)揮著重要的作用。隨著測序技術(shù)和生物信息學的快速發(fā)展,GenBank等重要分子生物數(shù)據(jù)庫中登陸的序列呈指數(shù)增長,截至2007年4月,NCBI、EMBL和DDBJ3大數(shù)據(jù)庫收錄的核酸序列已經(jīng)達到67,218,344條,共計71,292,211,453堿基時,其中棉花EST有281,233條,利用生物信息學手段對棉纖維發(fā)育相關(guān)的EST進行大規(guī)模分析顯得日益重要。本實驗利用138,08
2、6條與棉纖維發(fā)育相關(guān)的ESTs進行生物信息學研究,開發(fā)新標記和功能分析,為加密遺傳圖譜、基因定位、發(fā)掘新基因,比較基因組、基因網(wǎng)絡(luò)分析和分子進化奠定堅實的基礎(chǔ)。 為了在棉花中開發(fā)EST-SSR功能性標記,利用生物信息學方法對NCBI網(wǎng)上公開的63485條雷蒙德氏棉(Gossypium raimondii Ulbrich)ESTs序列進行EST-SSRs特征分析。剔除冗余序列,得到非冗余序列58906條。在非冗余序列中發(fā)現(xiàn)含不同重
3、復基元SSRs的EST序列有2620條,共2818個EST-SSRs,EST-SSRs序列的頻率是4.45%,平均相隔14.8kb出現(xiàn)一個SSR。在1-6bp的重復基元中,三核苷酸重復基元的SSRs出現(xiàn)頻率最高(38.31%),其次是二核苷酸(24.09%)、單核苷酸(23.35%)。統(tǒng)計所有的重復基元類型,所占比例最大的是A/T(18.67%),其次是AT/TA(14.83%)。在復合型(Compound)發(fā)現(xiàn)三核苷酸串聯(lián)三核苷酸的重
4、復基元出現(xiàn)頻率最高,為48.65%。利用Prime 3軟件,設(shè)計了1554對EST-SSRs引物,應(yīng)用這些引物對我室四倍體作圖親本陸地棉TM-1和海島棉海7124進行多態(tài)性檢測,其中744對有多態(tài)性,多態(tài)性頻率為47.9%。這些EST-SSRs已有效用于不同棉種間的分布特征比較及染色體定位等方面研究。 對來自A組、D組和AD組的12個棉纖維發(fā)育時期混合cDNA文庫的138,086條ESTs序列進行不同棉種間EST序列同源性比較,
5、其中A組(G. arboreum,7-10dpa)39,117條、D組(G. raimondii,-3 to 3dpa)32,316條和AD組(G. hirsutum,10個文庫,覆蓋-3-25dpa)66,653條,通過同一種內(nèi)EST序列拼接分析,分別得到A、D和AD三個棉種的Unigenes16,100條、11,912條和14,307條,共42,319unigenes。經(jīng)過對不同基因組間的Unigenes序列相似性分析,得到七個集合
6、(D∩一A∩一AD、AD ∩一A ∩D、A ∩ D ∩ AD、A ∩ D ∩一AD、A ∩ AD ∩一D、A ∩-D ∩一AD和D ∩ AD ∩一A)的相似序列,分別對A組和D組間共有而在AD組間沒有相似性(A ∩ D ∩-AD)的序列937條,A組和AD組間有而在D組間沒有的(A∩ AD ∩一D)2,717條,D組和AD組間有而在A組間沒有的(D ∩ AD ∩-A)2188條,三個組間相似性高的序列(A ∩ D ∩ AD)共有2441
7、條,D組獨有(D ∩-A ∩-AD)的6346,A組獨有(A ∩ D ∩-AD)的7996和AD組獨有的(ADN ∩-A ∩ D)4467條Unigenes進行了功能注釋和代謝分析。結(jié)果表明: (1)A組、D組和AD組間不同關(guān)系(D ∩-A ∩-AD、AD ∩ A ∩ D、A ∩ D ∩ AD、A ∩ D ∩-AD、A ∩ AD ∩-D、A ∩-D ∩-AD和D ∩ AD ∩-A七個集合)的相似性序列進行功能分類分成生物進程(B
8、iological Process)、細胞組分(Cellular Component)和分子功能(Molecular Function)3個類型。在同一功能類型不同集合中所占比例最大的前兩種功能基本相同,生物進程中所占比例最大的是cellular process,其次是metabolicprocess;細胞組分中所占比例最大的是cell/cell part,其次是organelle;分子功能中所占比例最大的兩個是catalytic ac
9、tivity和binding,即在棉纖維發(fā)育進程中,具有催化活性的基因在不同棉種中均發(fā)揮著重要作用。 (2)對A、D、AD基因組七個集合27,092和陽似性序列進行功能和代謝分析。功能分析表明,13,845條功能已知,13,247條未知功能.利用KEGG數(shù)據(jù)庫進一步對已知功能的13,845條序列進行代謝分析,2,543條Unigenes有代謝途徑,其中能量和碳水化合物代謝最多(1607,63.19%),其次是氨基酸代謝(718,
10、28.23%)。在已知功能的13,845條序列中與棉纖維發(fā)育相關(guān)的重要基因如膨脹素、纖維素合酶、蔗糖合酶、UDP、磷酸烯醇丙酮酸羧化酶、蔗糖轉(zhuǎn)運蛋白、MYB家族和液泡H+-ATPases(V-ATPase)都存在。通過對D(D5)基因組扣AD(A2D5)基因組間的與棉纖維發(fā)育相關(guān)的Unigenes功能分析發(fā)現(xiàn),D組38.86%((2188+2441)/11912)的Unigenes與AD組中的Unigenes具有相同的功能。說明在D基因
11、組和AD基因組中在棉纖維起始發(fā)育階段有很多相似的表達基因,盡管D基因組的種子上只有短絨沒有生產(chǎn)上可利用的纖維,但D基因組和AD基因組在轉(zhuǎn)錄水平上的高同源性表明D基因組蘊含著決定纖維發(fā)育的基因。A基因組和AD基因組間有5158條Unigenes有相似性。5158條序列中有847(16.42%)條序列有代謝途徑。在代謝方面主要以碳水化合物和能量代謝與氨基酸代謝為主。對A基因組(7 to10dpa)和D基因組(-3 to 3dpa)中3378
12、條相似性序列進行代謝和功能分析,2916條序列有功能,748條序列在KEGG數(shù)據(jù)庫中找到代謝途徑。通過分析A、D基因組問的相似序列來源說明上述基因在纖維啟動和伸長階段均在表達。 (3)四倍體AD基因組與二倍體A和D基因組的轉(zhuǎn)錄產(chǎn)物比較發(fā)現(xiàn)有4522(31.61%,A ∩ D ∩ AD)Unigenes在A和D基因組共同表達,表明這些基因是來源比較保守的祖先基因,它們并合到四倍體AD基因組中仍然轉(zhuǎn)錄,發(fā)揮相應(yīng)的功能及參與相應(yīng)的代謝
13、進程。在A ∩ AD ∩ D中有2717(18.99%)Unigenes在A基因組中找到相似序列而在D基因組中沒有,說明這些Unigenes僅在纖維發(fā)育伸長階段表達或在A和AT基因組?;磉_;在D ∩ AD ∩-A中有2601(18.18%)條Unigenes在D基因組中找到相似序列而在A基因組中沒有,說明這些Unigenes僅在纖維起始階段特異表達或在D和DT基因組專化表達;而在AD ∩-A ∩-D中有4467(31.22%)Unig
14、enes在A和D基因組中均未找到相似序列,是AD基因組中特有的轉(zhuǎn)錄產(chǎn)物,可能是由于多倍化后產(chǎn)生新的轉(zhuǎn)錄產(chǎn)物,進而在功能上發(fā)生了變化。 (4)通過A和D基因組相互比較發(fā)現(xiàn)A基因組有4797(29.77%)Unigenes在D基因組中有相似序列,D基因組在A基因組中有3378(28.36%)Unigenes存在相似性,表明相似Unigenes在纖維發(fā)育起始階段和伸長期均表達。在A和D基因組中沒有相似性的序列分別是11303(70.20%)和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 胃癌相關(guān)基因EST序列的生物信息學分析.pdf
- 鹿茸發(fā)育相關(guān)基因篩選和生物信息學分析.pdf
- 棗樹cDNA文庫EST序列的生物信息學分析.pdf
- 棉花纖維發(fā)育相關(guān)基因時空表達及其生物信息學分析.pdf
- 肺癌相關(guān)EST序列的生物信息學分析和新基因發(fā)現(xiàn)研究.pdf
- 肺癌相關(guān)MAGE家族的生物信息學分析.pdf
- 高原高血壓相關(guān)基因的生物信息學分析.pdf
- myc基因的生物信息學分析
- 荔枝果皮發(fā)育cDNA文庫構(gòu)建與生物信息學分析.pdf
- 胃癌相關(guān)新基因的克隆及生物信息學分析.pdf
- 黃瓜dvr基因的生物信息學分析
- 孤獨癥的生物信息學分析.pdf
- 水稻osssr基因的生物信息學分析
- 基于錨定RT-PCR的青蒿EST克隆、測序及生物信息學分析.pdf
- 宮頸癌相關(guān)基因的篩選及生物信息學分析.pdf
- 菠菜Y染色體特異EST序列的快速克隆及生物信息學分析.pdf
- 帕金森病相關(guān)基因的篩選及生物信息學分析.pdf
- 胞外多肽的生物信息學分析與應(yīng)用.pdf
- 綿羊mhc classⅱ基因的生物信息學分析
- 水稻AGO基因家族的生物信息學分析.pdf
評論
0/150
提交評論