基于不完備決策表的屬性約簡及規(guī)則獲取算法的研究.pdf_第1頁
已閱讀1頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著高科技的飛速發(fā)展,全世界每天都有幾十億的人在使用手機、電腦和其他電子產品,產生了大量的海量數據。大數據從互聯網向其他領域急速蔓延,各行各業(yè)都已經被數據給滲透,對于海量數據的有效處理成為目前研究的熱點之一。在2015年的兩會期間,李總理簽訂了國務院有關推進“互聯網+”行動的指導意見,給互聯網與傳統(tǒng)行業(yè)之間的有效結合提供了政策依據。數據挖掘的發(fā)展優(yōu)勢越來越突出,占據了互聯網的廣闊天地。所謂數據挖掘就是對數據庫中的數據,利用一些數據處理的

2、方法,查找出在信息之間存在的內在關系的過程。包含數理統(tǒng)計、模式識別、神經網絡等技術,廣泛應用于電信、航空公司、政府和科學領域中。
  粗糙集是數據挖掘的方法之一,是一種用于處理不準確、含有缺省值的工具。相較于模糊集,它最突出的特點是不需要其他先驗的信息,或附加的知識,就可以直接處理信息,找出海量數據中的隱含知識,應用于實際生活中。在數據挖掘的過程中,屬性約簡可以被看做為一個預處理的步驟,同時在粗糙集理論中占據了舉足輕重的地位。屬性

3、約簡可以定義為在保證知識庫能夠有效的區(qū)別庫中含有的對象的前提下,將其中不能起到決定作用的屬性消去。因此,在操作之后可以有效地減少知識庫中的屬性表示,同樣也保證了對象基本信息的完整性。在將知識庫中的冗余屬性消去之后,在很大程度上降低了知識所占用的空間,有效的減少了成本支出。
  在目前的研究進程中,將粗糙集的屬性約簡分成了兩種不同的類型,一種是包含全部的信息,叫做完備知識表,另一種中含有不確定的或者空缺的信息,命名為不完備知識表。完

4、備知識表指的是在知識系統(tǒng)中所有的對象信息都是準確并且全面的,現在對于完備知識系統(tǒng)的屬性約簡探索相對來講是比較全面也比較成熟的,在現實的應用中也施展出來了很大的引導作用。但是,實際生活中由于數據搜集設備的不可避免的誤差,或者是搜集過程中環(huán)境的影響等情況,導致知識系統(tǒng)中會有一些信息缺失的情況存在,原有完備知識系統(tǒng)的算法已經不能適用于這種情況。對含有缺失信息的決策表的研究是未來科學家和學者們重點關注的地方。
  此外,規(guī)則獲取是粗糙集理

5、論中的一個比較實用的領域。隨著信息爆炸式的增長,企業(yè)和各種組織積累了海量的數據,但是這些數據本身并不是有用的信息,在數據中的規(guī)則才是對企業(yè)做出有效決策提供幫助的信息,可以使企業(yè)在處理數據信息時有可靠的依據。因此獲取決策知識庫中的規(guī)則同樣具有實用性。
  本文對當前學者在粗糙集中屬性約簡和規(guī)則獲取中取得的研究成果進行了學習,在結合他們的基礎上,進行了以下創(chuàng)新:
  (1)在不完備知識系統(tǒng)中,引入了基于粒度的差別矩陣,利用條件屬

6、性在區(qū)別對象時出現頻率的屬性約簡思想,在粒度差別矩陣的基礎上,構造了計算屬性頻率的啟發(fā)函數。以知識粒度為啟發(fā)信息,提出了新的約簡算法,使得算法的時空復雜度都得到了很大幅度的降低,分別降為O(K|C‖U|)(其中K=max{|T(xi)|,xi∈U}和O(|U|),最后通過數據集進行仿真實驗,證明了算法相較于同類算法有較高的時間效率。
  (2)介紹了LEM2規(guī)則獲取算法總有屬性-值對是在反復的被納入候選屬性-值對,然后又在程序的后

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論