

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、鼠疫耶爾森氏菌(Yersinia pestis)是一種能夠引起致命全身感染的高危細(xì)菌,世界上曾發(fā)生過(guò)三次鼠疫大流行,死亡人數(shù)過(guò)億。根據(jù)WHO的數(shù)據(jù),僅2001-2015年間,全球就發(fā)生18次鼠疫公共安全事件。中國(guó)目前已經(jīng)發(fā)現(xiàn)12塊典型的鼠疫自然疫源地,分布于15個(gè)省,占國(guó)土陸地總面積的15%。
自2001年Sanger實(shí)驗(yàn)室發(fā)表第一株鼠疫菌CO92全基因組起,目前已有12株鼠疫菌的完成圖序列被公布,且都進(jìn)行了基因組注釋工作。由
2、于高通量實(shí)驗(yàn)技術(shù)的快速發(fā)展,鼠疫菌各方面研究工作產(chǎn)出了大量數(shù)據(jù),對(duì)其致病和傳播的理論認(rèn)識(shí)也得到提高。因此重新審視基于過(guò)去知識(shí)的基因組注釋時(shí)發(fā)現(xiàn):原有信息存在諸多局限性甚至錯(cuò)誤,而且這些錯(cuò)誤信息會(huì)隨著以同源序列比對(duì)為基礎(chǔ)的注釋工作被不斷復(fù)制、放大、擴(kuò)散。研究者曾使用比較基因組學(xué)、轉(zhuǎn)錄組和蛋白基因組學(xué)方法對(duì)個(gè)別鼠疫菌基因組進(jìn)行了重注釋,但這些注釋側(cè)重于基因功能矯正和發(fā)現(xiàn)新基因等方面,數(shù)據(jù)內(nèi)容不夠全面。因此需要?dú)w納、整合、完善已有鼠疫菌知識(shí)庫(kù)
3、,在過(guò)去基因組注釋結(jié)果基礎(chǔ)上,通過(guò)增加新的實(shí)驗(yàn)數(shù)據(jù)、使用改進(jìn)的算法對(duì)序列進(jìn)行重新分析、修正可能存在的注釋錯(cuò)誤,以進(jìn)一步完善鼠疫菌基因組注釋結(jié)果,最終達(dá)到系統(tǒng)化加深鼠疫菌功能、生物行為和致病機(jī)理認(rèn)識(shí)的目的。
數(shù)據(jù)共享是推動(dòng)研究知識(shí)進(jìn)步的重要方法。但除了大型公共數(shù)據(jù)庫(kù)外,僅有極少數(shù)原核模式生物(例如大腸桿菌)建立了組學(xué)數(shù)據(jù)庫(kù)。因此為了給研究者提供更加完整、準(zhǔn)確、且易于查用的鼠疫菌注釋信息,有必要在收集整合鼠疫菌多種類型實(shí)驗(yàn)數(shù)據(jù)和重
4、注釋結(jié)果基礎(chǔ)上,建立了針對(duì)該物種的跨組學(xué)數(shù)據(jù)庫(kù)系統(tǒng)。
本研究工作的主要數(shù)據(jù)來(lái)源包括:①基因組序列。NCBI提供的12株鼠疫菌的完成圖,它們是注釋的基礎(chǔ);②91001的蛋白組質(zhì)譜數(shù)據(jù)。質(zhì)譜結(jié)果是一種格式化、標(biāo)準(zhǔn)化的數(shù)據(jù),篩選后可以方便地使用,同時(shí)這類數(shù)據(jù)直接來(lái)源于實(shí)驗(yàn),數(shù)據(jù)質(zhì)量高;③RNA-seq數(shù)據(jù),來(lái)源于對(duì)91001菌株進(jìn)行的RNA測(cè)序;④表達(dá)譜數(shù)據(jù)。來(lái)自91001基因芯片實(shí)驗(yàn),這些數(shù)據(jù)顯示基因在多種環(huán)境下的表達(dá)量,雖然暫時(shí)
5、難以在注釋中使用,但是可以為研究人員提供一個(gè)參考。此外,補(bǔ)充了文獻(xiàn)中發(fā)表的相關(guān)數(shù)據(jù)。
數(shù)據(jù)重注釋工作包括兩部分,第一部分是數(shù)據(jù)預(yù)處理。首先,結(jié)合多組學(xué)數(shù)據(jù)和生物信息軟件、數(shù)據(jù)庫(kù),采用de novo從頭注釋的方法,共同完成重注釋工作。從基因預(yù)測(cè)開(kāi)始,重新鑒定CDS區(qū),修正部分基因的起始位點(diǎn);結(jié)合多個(gè)蛋白注釋數(shù)據(jù)庫(kù),確定基因的功能;對(duì)于非基因區(qū),采用預(yù)測(cè)工具、數(shù)據(jù)庫(kù)和文獻(xiàn)注釋出 ncRNA;最后,在全基因組范圍,注釋出重復(fù)序列、移
6、動(dòng)元件注釋工具等。第二部分是數(shù)據(jù)整理和分析。數(shù)據(jù)經(jīng)過(guò)分類、篩選,確定數(shù)據(jù)標(biāo)準(zhǔn),進(jìn)行標(biāo)準(zhǔn)化處理過(guò)程,完成后進(jìn)行基因同源性分析、等位基因性分析等。整個(gè)過(guò)程需要對(duì)30多種軟件和數(shù)據(jù)庫(kù)進(jìn)行本地化和使用。
跨組學(xué)數(shù)據(jù)庫(kù)是一個(gè)以若干組學(xué)數(shù)據(jù)庫(kù)表為基礎(chǔ)的數(shù)據(jù)庫(kù),不同類型數(shù)據(jù)之間存在密切的相互聯(lián)系。構(gòu)建數(shù)據(jù)庫(kù)時(shí)采用信息系統(tǒng)的處理方法,結(jié)合鼠疫菌的生物學(xué)特點(diǎn),確定研究目標(biāo)后,從研究人員的需求出發(fā),首先進(jìn)行需求分析,評(píng)估系統(tǒng)的可行性,了解功能和業(yè)
7、務(wù)需求,初步制定出數(shù)據(jù)標(biāo)準(zhǔn),并構(gòu)建出數(shù)據(jù)模型;然后根據(jù)數(shù)據(jù)模型,進(jìn)行組學(xué)數(shù)據(jù)庫(kù)的結(jié)構(gòu)設(shè)計(jì)和功能設(shè)計(jì);最終基于MySQL關(guān)系數(shù)據(jù)庫(kù),使用Python Django框架進(jìn)行web service系統(tǒng)的開(kāi)發(fā)。
結(jié)合基因組、蛋白組、轉(zhuǎn)錄組等多組學(xué)數(shù)據(jù)和上述方法,本研究首先對(duì)鼠疫菌91001株進(jìn)行了全面的重注釋:移除了137個(gè)不可靠的編碼區(qū);修正了41個(gè)基因起始位點(diǎn)、以及7個(gè)假基因和392個(gè)假想基因的功能;增加了ncRNA、重復(fù)序列、移
8、動(dòng)元件等特殊基因組元件和基因組片段多樣性的注釋。通過(guò)對(duì)信息分析算法和軟件等的梳理整合,建立起可應(yīng)用于其他鼠疫菌的半自動(dòng)化重注釋工作流程;并進(jìn)一步將該流程應(yīng)用于其他11株鼠疫菌完成圖序列。最后,采用關(guān)系數(shù)據(jù)庫(kù)和web框架,構(gòu)建了基于互聯(lián)網(wǎng)絡(luò)的鼠疫菌跨組學(xué)數(shù)據(jù)庫(kù)系統(tǒng)——TODY分析平臺(tái)(http://tody.bmi.ac.cn/),方便研究者對(duì)重注釋數(shù)據(jù)進(jìn)行查詢和使用。在等位基因多樣性處理和Web service服務(wù)系統(tǒng)實(shí)現(xiàn)的過(guò)程中,采用
9、了并行計(jì)算技術(shù)和分布式調(diào)度系統(tǒng),大大減少了計(jì)算時(shí)間,為下一步大規(guī)模數(shù)據(jù)分析和處理提供知識(shí)儲(chǔ)備和技術(shù)支持。
本工作融合了生物實(shí)驗(yàn)、生物學(xué)知識(shí)、生物信息工具和計(jì)算機(jī)技術(shù),對(duì)明確鼠疫菌基因組的結(jié)構(gòu)和功能,揭示其更多的生物學(xué)特性具有重要意義。下一步我們將增加更多的相關(guān)文獻(xiàn)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù),不斷豐富、充實(shí)鼠疫菌組學(xué)數(shù)據(jù)庫(kù);通過(guò)實(shí)驗(yàn)進(jìn)行重注釋結(jié)果的準(zhǔn)確性驗(yàn)證;尋找合適的數(shù)據(jù)挖掘模型,進(jìn)行深層次的數(shù)據(jù)分析,構(gòu)建出鼠疫菌知識(shí)庫(kù);不斷完善web
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鼠疫耶爾森氏菌與假結(jié)核耶爾森氏菌比較基因組學(xué)研究.pdf
- 鼠疫耶爾森氏菌pYC質(zhì)粒的全基因組初步分析.pdf
- 鼠疫耶爾森氏菌噬菌體Yep-phi基因組研究及其受體鑒定.pdf
- 鼠疫耶爾森氏菌布氏田鼠疫源地菌株91001全基因組序列測(cè)定及初步分析.pdf
- 鼠疫耶爾森氏菌基因組多態(tài)性研究及快速鑒定溯源系統(tǒng)的建立.pdf
- 耶爾森氏菌91001株基因組測(cè)序、比較基因組學(xué)及Ⅲ型分泌系統(tǒng)研究.pdf
- 鼠疫耶爾森氏菌知識(shí)庫(kù)的建立.pdf
- 鼠疫耶爾森氏菌密度感應(yīng)系統(tǒng)研究.pdf
- 鼠疫耶爾森菌課件
- 鼠疫耶爾森氏菌新型候選DNA疫苗的構(gòu)建及其免疫效果鑒定.pdf
- 基于DNA芯片技術(shù)鼠疫耶爾森氏菌在不同條件下的轉(zhuǎn)錄組學(xué)研究.pdf
- 環(huán)境因素調(diào)控鼠疫耶爾森氏菌基因表達(dá)的比較轉(zhuǎn)錄譜學(xué)研究.pdf
- 鼠疫耶爾森氏菌Pla蛋白的提取與純化.pdf
- 鼠疫耶爾森氏菌密度感應(yīng)系統(tǒng)與毒力關(guān)系研究.pdf
- 鼠疫耶爾森氏菌基因表達(dá)譜技術(shù)平臺(tái)的建立與應(yīng)用.pdf
- 基因組島數(shù)據(jù)庫(kù)及分析平臺(tái)構(gòu)建.pdf
- cAMP受體蛋白調(diào)控鼠疫耶爾森氏菌毒力的研究.pdf
- 人類基因組結(jié)構(gòu)注釋數(shù)據(jù)庫(kù)構(gòu)建及數(shù)據(jù)可視化展示.pdf
- 鼠疫耶爾森氏菌降解其分泌的鼠毒素研究.pdf
- 鼠疫耶爾森氏菌LcrV突變體的初步研究.pdf
評(píng)論
0/150
提交評(píng)論