變精度粗糙集擴(kuò)展模型及屬性約簡算法研究.pdf_第1頁
已閱讀1頁,還剩62頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、經(jīng)典粗糙集模型分類要求嚴(yán)格按等價(jià)關(guān)系進(jìn)行,不存在某種程度上的包含關(guān)系,在實(shí)際應(yīng)用中,缺乏對(duì)噪聲數(shù)據(jù)的適應(yīng)能力。為了克服這個(gè)缺點(diǎn),W.ziarko提出一種變精度的粗糙集模型,引入了變精度β因子,允許上近似集和下近似集存在一定的分類誤差,對(duì)噪音數(shù)據(jù)具有一定的容錯(cuò)能力,更加符合實(shí)際應(yīng)用的需要。自引入變精度粗糙集模型以來,粗糙集理論的實(shí)際應(yīng)用得到了較快的發(fā)展,變精度粗糙集模型是對(duì)經(jīng)典粗糙集理論的擴(kuò)展。
  變精度粗糙集模型雖然可以提高粗糙

2、集模型的抗噪聲能力,但是并沒有考慮到每個(gè)對(duì)象的重要性問題。通常粗糙集模型在對(duì)決策信息系統(tǒng)進(jìn)行數(shù)據(jù)預(yù)處理后,往往是把相同的規(guī)則直接合并成一個(gè)規(guī)則,對(duì)不同對(duì)象的重要性問題未加考慮。而在現(xiàn)實(shí)生活中,決策信息系統(tǒng)中一個(gè)規(guī)則僅出現(xiàn)一次或出現(xiàn)多次意義可能是完全不同的。因此,為了能更加適用于實(shí)際生活中的數(shù)據(jù),在變精度粗糙集理論研究的基礎(chǔ)上,引入對(duì)象重要性的概念,改進(jìn)變精度粗糙集模型,并對(duì)基于改進(jìn)后模型的屬性約簡算法進(jìn)行深入研究。
  本文的主要

3、工作如下:
  (1)在對(duì)經(jīng)典粗糙集及變精度粗糙集模型進(jìn)行研究的基礎(chǔ)上構(gòu)建了一種基于對(duì)象重要性的變精度粗糙集模型(OI-VPRS),對(duì)變精度粗糙集模型的分類錯(cuò)誤率、包含度、近似空間及屬性約簡進(jìn)行了重定義,并給出該模型的一些性質(zhì)和定理,經(jīng)典粗糙集模型和變精度粗糙集模型可視為該模型的一個(gè)特例。通過對(duì)某決策表分別采用經(jīng)典粗糙集模型、變精度粗糙集模型和OI-VPRS模型進(jìn)行計(jì)算,結(jié)果表明:在相同的分類誤差水平上,該模型在分類質(zhì)量和抗噪音能

4、力方面都較前兩個(gè)模型有所提高,該模型不僅具有容錯(cuò)性,并較好地體現(xiàn)了決策表中每個(gè)對(duì)象的重要程度,能合理地對(duì)現(xiàn)實(shí)數(shù)據(jù)進(jìn)行解釋。
  (2)對(duì)OI-VPRS模型下的屬性約簡算法進(jìn)行深入研究。首先,在對(duì)經(jīng)典粗糙集模型下基于屬性依賴度的約簡算法進(jìn)行研究的基礎(chǔ)上,提出了OI-VPRS模型下的基于屬性依賴度的約簡算法。算法采用了OI-VPRS模型下屬性依賴度的計(jì)算方法,并且為了得到更簡化的結(jié)果,引入了依賴度誤差因子ε。UCI實(shí)驗(yàn)結(jié)果表明,當(dāng)數(shù)據(jù)

5、集中各對(duì)象的重要性均勻分布時(shí),能夠得到與變精度模型相近的約簡結(jié)果和近似分類質(zhì)量。當(dāng)數(shù)據(jù)集中對(duì)象重要性存在較大的差異時(shí),基于OI-VPRS算法結(jié)果比變精度模型約簡結(jié)果更加簡化,同時(shí)分類質(zhì)量也較變精度粗糙集模型有所提高。其次詳細(xì)分析了分類誤差因子β和依賴度誤差因子ε的取值對(duì)約簡的影響,實(shí)驗(yàn)結(jié)果表明β取值增大,決策表的近似分類質(zhì)量增大,得到的約簡集中屬性個(gè)數(shù)減少,ε取值越大,得到的約簡越簡化,算法運(yùn)行時(shí)間也越短。
  (3)胡可云算法研

6、究表明利用屬性頻率求屬性重要性的計(jì)算量要優(yōu)于利用屬性依賴度求屬性重要性的計(jì)算量,因此,提出一種將屬性頻率和對(duì)象重要性作為啟發(fā)信息的約簡算法。算法首先計(jì)算決策表的可辨識(shí)矩陣,利用可辨識(shí)矩陣中屬性出現(xiàn)頻率和屬性所區(qū)分的對(duì)象的權(quán)值重新定義了屬性重要性函數(shù),并且在每添加一個(gè)屬性到約簡集后,都將可辨識(shí)矩陣中含有該屬性的項(xiàng)刪除,避免了屬性計(jì)算的重復(fù)性。該算法采用貪心的思想能夠保證找到一個(gè)約簡,并且時(shí)間復(fù)雜度較基于屬性依賴度算法的時(shí)間復(fù)雜度低。實(shí)驗(yàn)結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論