

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、人類正在步入一個(gè)以知識(shí)生產(chǎn)、應(yīng)用為最重要因素的知識(shí)經(jīng)濟(jì)時(shí)代。以知識(shí)發(fā)現(xiàn)為核心的智能信息處理技術(shù)在知識(shí)的生產(chǎn)過(guò)程中具有越來(lái)越重要的作用。分類具備一般知識(shí)發(fā)現(xiàn)的數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模型評(píng)估和知識(shí)表示的基本流程,是一項(xiàng)重要的知識(shí)發(fā)現(xiàn)任務(wù)。由于分類的廣泛應(yīng)用及其在化學(xué)化工領(lǐng)域的重要意義,對(duì)分類方法展開(kāi)研究不僅可以促進(jìn)數(shù)據(jù)挖掘技術(shù)的發(fā)展,還能極大地開(kāi)拓化學(xué)化工領(lǐng)域中知識(shí)發(fā)現(xiàn)的應(yīng)用前景。
目前,分類知識(shí)發(fā)現(xiàn)的研究和技術(shù)已有長(zhǎng)足進(jìn)步,
2、各種挖掘方法層出不窮,但一些有待研究的問(wèn)題也日趨突出。尤其在化學(xué)化工領(lǐng)域,由于采集和積累的數(shù)據(jù)往往具有多因子、非線性、高噪音和非均勻分布等特點(diǎn),常規(guī)的分析和處理方法不僅耗時(shí),而且難以有效地挖掘和發(fā)現(xiàn)其中所隱含的知識(shí),相關(guān)的分類知識(shí)發(fā)現(xiàn)方法和技術(shù)有待改進(jìn)和發(fā)展,對(duì)之展開(kāi)深入的研究,對(duì)促進(jìn)化學(xué)化工學(xué)科的發(fā)展具有重要的意義,也會(huì)產(chǎn)生巨大的經(jīng)濟(jì)價(jià)值。
粒計(jì)算是信息處理的一種新的概念和計(jì)算范式,覆蓋了所有與粒度相關(guān)的理論、方法、技術(shù)
3、和工具。粒計(jì)算的基本思想是模擬人類智能的特點(diǎn),在求解復(fù)雜問(wèn)題時(shí),通過(guò)選擇合適的粒度,降低問(wèn)題求解的難度,有助于找到一種較好的解決方案。粒計(jì)算原理為知識(shí)發(fā)現(xiàn)的研究提供了新途徑。但是,目前有關(guān)粒計(jì)算的研究大多還以理論研究為主,粒計(jì)算的應(yīng)用研究較少,尤其在化學(xué)化工領(lǐng)域,更鮮見(jiàn)文獻(xiàn)報(bào)道。本文歸納提出了粒計(jì)算用于知識(shí)發(fā)現(xiàn)的四項(xiàng)基本原理,利用此原理,對(duì)當(dāng)前分類知識(shí)發(fā)現(xiàn)方面的若干挑戰(zhàn)問(wèn)題進(jìn)行了研究,提出了相應(yīng)的策略和方法,以用于化學(xué)化工領(lǐng)域中的相關(guān)問(wèn)
4、題。
本文的主要研究工作和成果可歸納如下:
1.?;途垲愂且环N對(duì)知識(shí)進(jìn)行總結(jié)概括的方法,聚類生成的類刻畫(huà)了數(shù)據(jù)所蘊(yùn)涵的類知識(shí)。聚類分析,是軟科學(xué)研究的重要的基礎(chǔ)性方法,也是一種有效的手段。自適應(yīng)共振(Adaptive Resonance Theory,ART)網(wǎng)絡(luò)ART2用于聚類,具有許多優(yōu)點(diǎn)。同時(shí)也存在對(duì)輸入的漸變模式不敏感,抗噪音性能有限的缺點(diǎn)。為此,本文提出了改進(jìn)的自適應(yīng)共振網(wǎng)絡(luò)(ART2 with
5、Enhanced Triplex Matching mechanism,ETM-ART2),加強(qiáng)了內(nèi)部檢測(cè)機(jī)制,以提高ART2網(wǎng)絡(luò)的性能,對(duì)橄欖油樣本進(jìn)行聚類分析試驗(yàn),其聚類性能優(yōu)良,尤適用于海量數(shù)據(jù)的聚類問(wèn)題。ETM-ART2還可為分類問(wèn)題構(gòu)建信息粒,有助于知識(shí)發(fā)現(xiàn),并提高分類性能。
2.粒的構(gòu)建是應(yīng)用粒計(jì)算的基本步驟之一。本文根據(jù)粒度求解近似原理,提出了采用ART網(wǎng)絡(luò)構(gòu)建信息粒,可為分析對(duì)象方便、快速地建立合適的信息粒
6、;又由GrC(Granular computing,GrC)問(wèn)題簡(jiǎn)化原理,提出了基于信息粒的分類知識(shí)發(fā)現(xiàn)的求解方案。開(kāi)發(fā)了兩個(gè)算法:其一,基于信息粒的模糊分類知識(shí)發(fā)現(xiàn)算法(Information Granulation based FuzzyClassification Knowledge Discovery Method, IG-FCKDM);其二,基于粒的關(guān)鍵特征分析(Key Feature Analysis based on Gr
7、anulation,KFAG)、由C4.5實(shí)施分類規(guī)則挖掘的算法KFAG-C4.5。IG-FCKDM側(cè)重于求解非均衡兩分類問(wèn)題和分類誤差敏感問(wèn)題,即分類判定錯(cuò)誤可能帶來(lái)巨大損失。它采用Fuzzy ART構(gòu)建信息粒,繼而通過(guò)模糊處理,提取分類規(guī)則。對(duì)疾病診斷的試驗(yàn)表明,IG-FCKDM處理此類問(wèn)題效果較好,且其預(yù)測(cè)正確性和可信度對(duì)用戶有更重要的意義。KFAG-C4.5可用于一般分類問(wèn)題和多類非均衡分類問(wèn)題。它采用ETM-ART2構(gòu)建信息粒
8、,再進(jìn)行本文提出的基于粒的關(guān)鍵特征分析,并將各屬性合理地劃分為具有較強(qiáng)的類別區(qū)分能力的若干子屬性,子屬性數(shù)不致過(guò)多。使信息粒由子屬性描述,并以離散值0或1表示。便于最后采用C4.5實(shí)施分類規(guī)則挖掘。對(duì)玻璃兩分類和多類非均衡問(wèn)題的試驗(yàn)表明,KFAG-C4.5具有較好的分類識(shí)別能力。IG-FCKDM和KFAG-C4.5這兩個(gè)算法挖掘所得知識(shí)雖然表現(xiàn)形式有所不同,但都很簡(jiǎn)潔,可理解性好,易于各類專業(yè)人員分析,且較好地解決了非均衡數(shù)據(jù)的分類問(wèn)題
9、。
3.集成學(xué)習(xí)??商岣邌蝹€(gè)分類器的性能,隨著研究的深入,選擇性集成學(xué)習(xí)逐漸成為研究熱點(diǎn)。當(dāng)前,基于隨機(jī)優(yōu)化算法的選擇性集成算法,大多以泛化誤差為目標(biāo),基本忽略了個(gè)體分類器本身的特性,尤其是差異性度量。這些方法也取得了一些成果,但計(jì)算復(fù)雜度較高,效率偏低。為解決個(gè)體分類器差異性度量的難題,本文基于GrC問(wèn)題的等價(jià)原理,將選擇性集成問(wèn)題轉(zhuǎn)換到較簡(jiǎn)單的關(guān)聯(lián)空間,研究了一種簡(jiǎn)單而高效的選擇機(jī)制,開(kāi)發(fā)了基于知識(shí)粒、兼顧正確率和差異
10、性的選擇集成(Correctness and Diversity based Selective Ensemble,CDSE)算法。將其用于毒性作用機(jī)制的分類試驗(yàn),其性能優(yōu)于集成算法Bagging、AdaBoost.M1,以及單個(gè)C4.5分類器。CDSE從優(yōu)選個(gè)體分類器的角度出發(fā),為提高集成分類的泛化性能和效率提供了有效的解決方案。
4.在集成分類器的構(gòu)建生成和預(yù)測(cè)判定這兩個(gè)層面上,提出了自適應(yīng)的新思路,將CDSE拓展為自
11、適應(yīng)集成(Correctness and Diversity based Adaptive Selective Ensemble,CDASE)學(xué)習(xí)算法,進(jìn)一步提高了集成分類的泛化性能。CDASE針對(duì)每一類別,自適應(yīng)地生成特定適用的集成分類器,組合為集成分類器組AE-Group,其中各個(gè)集成分類器間存在包容性,故其占用的計(jì)算資源甚少,有效地減少了存儲(chǔ)空間和計(jì)算時(shí)間。AE-Group又以自適應(yīng)方式,即從集成分類器組中選用最適合的集成分類器對(duì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 粒計(jì)算及其在圖像分類中的應(yīng)用研究.pdf
- 基于粒計(jì)算的信息系統(tǒng)知識(shí)發(fā)現(xiàn)研究.pdf
- 基于粒度計(jì)算的知識(shí)發(fā)現(xiàn)研究及其應(yīng)用.pdf
- 粒計(jì)算及其應(yīng)用研究.pdf
- 粒度計(jì)算理論及其在知識(shí)發(fā)現(xiàn)中的應(yīng)用.pdf
- 基于粗糙集的分類知識(shí)發(fā)現(xiàn)方法及其應(yīng)用研究.pdf
- 覆蓋粒計(jì)算及其應(yīng)用研究.pdf
- 增量型社團(tuán)發(fā)現(xiàn)算法及其應(yīng)用.pdf
- 基于粗糙集的數(shù)據(jù)分類知識(shí)發(fā)現(xiàn)方法及其應(yīng)用研究.pdf
- 航次知識(shí)發(fā)現(xiàn)及其應(yīng)用研究.pdf
- 基于粒計(jì)算的學(xué)生成績(jī)數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)的研究.pdf
- 基于粒計(jì)算的決策表知識(shí)約簡(jiǎn)算法研究.pdf
- 基于遺傳算法的知識(shí)發(fā)現(xiàn)算法研究及應(yīng)用.pdf
- 機(jī)會(huì)發(fā)現(xiàn)算法及其應(yīng)用研究.pdf
- 基于粒計(jì)算的旋轉(zhuǎn)機(jī)械故障診斷知識(shí)發(fā)現(xiàn)方法研究.pdf
- 混合數(shù)據(jù)知識(shí)發(fā)現(xiàn)的粗糙計(jì)算模型和算法.pdf
- 粒計(jì)算的高效知識(shí)約簡(jiǎn)算法與缺失數(shù)據(jù)處理.pdf
- 復(fù)雜網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)算法的研究及其應(yīng)用.pdf
- 流分類算法及其應(yīng)用研究.pdf
- 教學(xué)信息中的分類知識(shí)發(fā)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論