基于神經網絡和支持向量機的生物數(shù)據(jù)分類.pdf_第1頁
已閱讀1頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在過去的幾年時間里,人工智能在生命科學和醫(yī)學等各個領域都發(fā)揮著無可替代的重要作用。起初最主要應用在序列分析中,這個方面時至今日也仍有很多重要問題亟待解決。
  隨著DNA測序技術的發(fā)展,新興的技術使得DNA和蛋白質的線性序列數(shù)據(jù)呈幾何級數(shù)增長。蛋白質二級結構預測(PSSP)這個領域的研究促進了機器學習方法在序列分析中的應用。本文有關蛋白質二級結構預測部分就是在這個研究背景的基礎上繼續(xù)進行了探究。我們設計了新型集成網絡,新型網絡對所

2、占比例較多的結構C卷曲結構預測準確率較高,其余兩種結構α螺旋與β折疊預測準確率和Q3準確率表現(xiàn)平平。本文除了介紹神經網絡和支持向量機等機器學習算法在蛋白質二級結構預測方面的應用,還探索了基于這兩種算法的乳腺癌早期篩查。
  針對蛋白質二級結構的數(shù)據(jù)是完成對其未知結構的預測,而針對乳腺癌患者和健康人的一些指標來對其是否患有乳腺癌做出早期的診斷。乳腺癌是一種發(fā)生在乳腺上皮的常發(fā)性惡性腫瘤,因此為臨床乳腺癌篩查診斷建立一種簡單、快速、高

3、效的方法具有很強的實際意義。
  本文提出了一種基于神經網絡與支持向量機的乳腺癌早期篩查方法。文中首先應用PCA(主成分分析)對原始數(shù)據(jù)進行降維處理,然后運用神經網絡與支持向量機分別進行訓練最后達到預測的目的。文中所包含的實驗數(shù)據(jù)是由258例新診斷為乳腺癌的病人和159例乳腺癌診斷為良性的病人,其中包含78例健康病例,選取的每個代謝組學的血斑點樣本包含23個氨基酸和26個酰基肉堿。實驗結果顯示,結合神經網絡的方法得到最高的敏感度可

4、達到97.1%,特異度可達到93.9%,精確度可達到91.5%;結合支持向量機的方法得到的實驗結果中,敏感度最高可達到93.5%,特異度最高為93.8%,精確度可達到93.6%。因此,兩種智能化算法各有千秋,在訓練集數(shù)量與測試集數(shù)量相等或稍多于測試集數(shù)量時,神經網絡方法表現(xiàn)較好;在訓練集數(shù)量明顯多于測試集時,支持向量機方法表現(xiàn)較好。相比于之前參考文獻[42]中的蛋白標記物的方法所達到的92.2%的敏感性和84.4%的特異性,文中方法有了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論