乳腺癌復發(fā)相關基因的篩選及系統(tǒng)生物學分析.pdf_第1頁
已閱讀1頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、乳腺癌是全世界嚴重威脅女性健康的首位惡性腫瘤。在近十年里,不僅在發(fā)達國家里乳腺癌的發(fā)病率持續(xù)升高,發(fā)展中國家的乳腺癌患病率也已經超過宮頸癌,成為了女性癌癥死亡的首位因素,且乳腺癌的發(fā)病年齡呈現年輕化趨勢。然而隨著現代醫(yī)學的不斷發(fā)展,乳腺癌的診治水平有了顯著的提高,使乳腺癌的死亡率明顯下降,并改善了患者的生活質量。但是,乳腺癌的復發(fā)和轉移仍然占有相當大的比例,有文獻報道,乳腺癌術后復發(fā)現象大約占乳腺癌患者中的10%~30%之多,且出現復發(fā)

2、的患者的治愈率也會明顯降低,嚴重影響患者的生存率。
  系統(tǒng)生物學是一個以信息為基礎、以整合為靈魂、以干涉為鑰匙的對生物體系中所有組成包括基因、蛋白質等的構成進行研究,并探尋其中相互關聯的網絡關系的新型生物學交叉學科。它的系統(tǒng)性及整體性研究就是該學科的特點。系統(tǒng)生物學方法的研究包含了多種學術理論的支持,其中包括生物信息學研究、計算信息學研究、基因組學研究等。生物信息學作為系統(tǒng)生物學發(fā)展基礎的重要一部分,是一門以研究生物信息的采集、

3、儲存、處理、傳播為基礎的交叉學科。其總和了生命科學、信息學、統(tǒng)計學及計算機科學等多種技術手段,包含了海量的數據庫,還擁有多種在線分析軟件,收集并分析遺傳相關數據,探索生物學的奧秘。并對人類的基因及疾病發(fā)生相關的基因進行數據挖掘、統(tǒng)計分析、功能注釋、通路分析及網絡可視化分析,從而對疾病尤其是惡性腫瘤的發(fā)生發(fā)展有了更深一步的認識。
  本研究課題通過以Pubmed/Medline數據庫、Web of Science數據庫、CNKI(中

4、國知網)數據庫及萬方數據庫4個數據庫的文獻挖掘為研究基礎,總結出與乳腺癌復發(fā)相關的基因,通過文獻計量學及系統(tǒng)生物學的方法對當今研究現狀做出總結,并研究分析乳腺癌復發(fā)相關基因及miRNA(microRNA,內源性非編碼微小RNA)之間的相互作用關系,構建ceRNAs(compting endogenous RNAs,競爭性內源 RNAs)網絡調控圖,從而進一步了解乳腺癌復發(fā)相關基因的功能及作用通路,為探究乳腺癌復發(fā)的發(fā)生及發(fā)展的分子作用機

5、制提供更全面的信息和理論基礎,更為能夠進一步預防和治療乳腺癌的復發(fā)提供新的研究方向。
  第一部分:乳腺癌復發(fā)相關基因的篩選及生物信息學分析
  背景與目的:
  乳腺癌是我國最常見的女性惡性腫瘤之一,其發(fā)病率仍以每年3%的趨勢上升,且發(fā)病越來越年輕化。乳腺癌不僅是一個激素依賴性惡性腫瘤,更是一個復雜的多基因性的全身性、終身性疾病,遺傳及環(huán)境等因素都參與了乳腺癌的發(fā)生和發(fā)展,而乳腺癌的復發(fā)更讓我們認識到這個疾病有著同其

6、他惡性腫瘤一樣的侵襲性和危險性,它會大大降低乳腺癌患者的生存時間,嚴重威脅著廣大女性患者的生命?;蚪M學的發(fā)展讓我們越來越多的了解和認識腫瘤相關基因的功能及腫瘤細胞信號通路的作用。
  本研究的目的:通過對乳腺癌復發(fā)相關基因的生物信息學分析,了解與乳腺癌復發(fā)相關的基因的功能、信號通路及其表達蛋白質之間的相互作用的網絡構成,為探索乳腺癌復發(fā)的分子機制提供理論基礎。
  研究方法:
  檢索2001.01-2015.01期

7、間發(fā)表的所有關于乳腺癌復發(fā)相關基因的中英文文章,通過納入以人類為限定物種且能夠提供乳腺癌復發(fā)相關基因足夠信息的相關的研究文獻,排除綜述類及重復文獻等不相符文獻,篩選出有效文獻并提取所需要的數據,應用NoteExpress文獻檢索與管理軟件及Excel2010軟件進行納入文獻的管理及文獻計量學分析,并匯總與乳腺癌復發(fā)相關的基因。運用基因注釋工具GATHER(Gene annotation tool to help explain rela

8、tionships)在線軟件( http://gather.genome.duke.edu/)對乳腺癌復發(fā)相關基因進行GO( Gene Ontology,基因本體)功能分析。應用圖形化網絡顯示及分析編輯免費開源軟件Cytoscape中的一個插件JEPETTO(Java Enrichment of Pathways Extended To Topology)(Version1.3.1)進行 KEGG(Kyoto Encyclopedia

9、of Genes and Genomes,京都基因與基因組百科全書數據庫)通路分析。采用STRING(Search Tool for the Retrieval of Interacting Genes/Proteins)在線軟件(http://string.embl.del/)繪制相關基因表達蛋白質的互作網絡圖,并應用Cytoscape軟件計算網絡及各節(jié)點的拓撲特性篩選出關鍵基因。
  結果:
  1.本研究共納入了196

10、篇中英文文獻,經分析得出,在近14年里對于乳腺癌復發(fā)的相關基因的研究論文數量處于顯著上升的趨勢,并總結出59個相關基因。
  2.GO分析發(fā)現乳腺癌復發(fā)相關基因及其產物的功能主要集中在細胞周期的調控、膠原蛋白的分解代謝、細胞的增殖及細胞生理過程的負調控等。
  3.KEGG通路分析發(fā)現乳腺癌復發(fā)相關基因在信號通路中主要參與了腫瘤信號通路、P53信號通路、ErbB信號通路、VEGF信號通路等。
  4.經STING軟件篩

11、選出59個相關基因中7個基因表達蛋白未參與網絡構建,52個相關基因表達蛋白存在相互作用,成功構建了相關基因表達蛋白互作圖。
  5.應用Cytoscape軟件共篩選出7個關鍵基因,分別為,是TP53(腫瘤蛋白p53)、VEGFA(血管內皮生長因子A)、ESR1(雌激素受體1)、ERBB2(人表皮生長因子受體2)、CDH1(上皮-鈣黏連蛋白)、PTEN(磷酸酶-張力蛋白抑癌基因)及MMP2(基質金屬蛋白酶)。
  結論:

12、>  1.成功篩選出乳腺癌復發(fā)相關的59個基因,并對其進行GO功能注釋及KEGG通路分析,為乳腺癌復發(fā)的分子機制提供理論基礎
  2.成功構建乳腺癌復發(fā)相關基因的網絡構建圖,并篩選出7個關鍵基因,提示TP53基因乳腺癌的復發(fā)過程密切相關,有利于研究相關基因的相互作用及密切關系,為乳腺癌復發(fā)的預防、診斷及治療提供了研究方向。
  第二部分:乳腺癌復發(fā)相關miRNA的篩選及ceRNAs調控網絡構建
  背景與目的:

13、  非編碼RNA(non-coding RNA,ncRNA),是一類除mRNA、tRNA和rRNA以外的,不編碼蛋白質卻發(fā)揮功能的RNA分子,它包含微小RNA(microRNA, miRNA)和長鏈非編碼RNA(long non-coding RNA,lncRNA)。microRNA是內源性非編碼微小RNA的總稱,它可以通過與靶基因的結合從而引導沉默復合體降解mRNA或者阻礙其翻譯,抑制其轉錄后的基因表達作用。ceRNA(comptin

14、g endogenous RNA,競爭性內源RNA)假說揭示了RNA之間相互作用的新機制。lncRNA是 ceRNA的其中一種,在細胞周期調控、分化調控、表觀遺傳學調控中發(fā)揮著重要的作用。系統(tǒng)生物學作為一門信息科學,整合了基因組學及轉錄組學等信息,系統(tǒng)分析其中的關聯性及網絡構造,構建ceRNAs網絡調控圖,對于生命的整個過程如細胞的生長、增殖及凋亡等,以及腫瘤的發(fā)生發(fā)展過程中,都起到了越來越重要的作用。
  本研究目的:通過實驗驗

15、證的數據庫及靶基因預測數據庫中篩選出乳腺癌復發(fā)相關的miRNA-靶基因,miRNA-lncRNA匹配對數,運用生物信息學分析,構建相關ceRNAs網絡調控圖,了解其中的相互作用,篩選出與乳腺癌復發(fā)相關的重要miRNA。
  研究方法:
  選用 POMA算法,利用3個實驗驗證的數據庫: miRecords(http://mirecords.biolead.org/)、TarBase(http://diana.cslab.ec

16、e.ntua.gr/tarbase/)、miRTarBase( http://mirtarbase.mbc.nctu.edu.tw/)及2個靶基因預測數據庫:starBase( http://www.targetscan.org/)和miRDB(http://www.microrna.org/microrna/home.do),采用Z=α/β公式(α代表僅受該miRNA調控的靶基因的個數。β代表受該 miRNA調控的所有靶基因的個數)。

17、以Z值>0.1為閾值,共同篩選出Z值>0.1的 miRNA定為有意義的乳腺癌復發(fā)相關的miRNA,并找出miRNA-靶基因匹配對數。應用starBase v2.0數據庫預測miRNA-lncRNA的相互關聯,找出相互作用的匹配對數。通過Cytoscape3.2.1軟件構建乳腺癌復發(fā)相關ceRNA網絡調控圖篩選相關重要miRNA。
  結果:
  1.本研究通過運用POMA篩選預測模型,在3個提供實驗驗證的數據庫和2個靶基因預

18、測數據庫的基礎上,篩選出乳腺癌復發(fā)相關miRNA共104個。通過Z公式評分后,大于閾值的miRNA共12個,分別為:miR-204、miR-29c、miR-29b、miR-146a、miR-9、miR-491、miR-222、miR-27b、miR-324-5p、miR-124、miR-141及miR-122。并找出16對miRNA-靶基因對應關系。
  2.通過starBase數據庫中內置的LncRNABase預測miRNA-l

19、ncRNA的相互關聯,檢索發(fā)現乳腺癌復發(fā)相關的lncRNA共12個,分別為:NEAT1(核副斑點包裝轉錄本1)、MALAT1(肺腺癌轉移相關轉錄本1)、XIST(X染色體失活特異轉錄本)、HCG18(人類主要組織相容性復合體組18)、KCNQ1OT1(KCNQ1相反鏈/反義轉錄物1)、SNHG7(小核仁RNA宿主基因7)、HOTAIR(HOX反轉錄 RNA)、TUG1(上調?;撬?)、GAS5(生長阻滯特異轉錄本5)、HCP5(人類主要

20、組織相容性復合體p5)、H19(母系印跡表達轉錄本)、MIAT(心肌梗死相關轉錄本)。并得到40對miRNA-lncRNA對應關系。
  3.通過應用Cytoscape軟件,成功將56對調控關系導入并構建了ceRNAs網絡調控圖,篩選出4個與乳腺癌復發(fā)相關重要 miRNA,分別為:miR-204、miR-29c、miR-29b及miR-146a。
  結論:
  成功構建出了與乳腺癌復發(fā)相關的ceRNAs網絡調控圖,并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論