

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、<p><b> 學 位 論 文</b></p><p> 用于加工中心的計算機智能監(jiān)測</p><p><b> 控制方法研究</b></p><p><b> 答辯委員會主席:</b></p><p><b> 評閱人:</b>
2、</p><p> 指導教師姓名: </p><p> 申請學位級別: 碩 士學科、專業(yè)名稱: 精密儀器及機械</p><p> 論文提交日期: 論文答辯日期:</p><p> 學位授予單位:河北工業(yè)大學</p><p> 20XX 年 X 月</p><p> 河北工業(yè)
3、大學碩士學位論文</p><p> 用于加工中心的計算機智能監(jiān)測控制方法研究</p><p><b> 摘要</b></p><p> 隨著現(xiàn)代工業(yè)生產自動化、連續(xù)化水平的不斷提高,加工中心的占有率也在增大,在生產中已經占有重要地位。加工中心在許多企業(yè)中被用于重要的加工環(huán)節(jié),如果出現(xiàn)故障后不能及時正確地進行故障診斷和維修,則會帶來較大的
4、經濟損失。隨著粗集理論近年來在智能信息處理研究領域獲得了迅速發(fā)展,它基于現(xiàn)實的大數(shù)據(jù)集,從中推理、發(fā)現(xiàn)知識和分類系統(tǒng)的某些特點,對于研究不精確知識的表達、學習、歸納方面有其獨特之處。</p><p> 本文研究了基于數(shù)據(jù)挖掘的加工中心故障診斷方法,跟以往的故障診斷方法不同,研究的方向并不是基于機械振動分析,而是采用了粗集理論結合神經網絡的方法。</p><p> 論文研究了粗集對故障數(shù)
5、據(jù)進行約簡的可行性,并應用自組織映射神經網絡的聚類功能,來實現(xiàn)連續(xù)屬性值離散化的方法;通過對診斷信息的分析,采取常規(guī)約簡方法,該方法實現(xiàn)了樣本條件屬性的約簡,可消除樣本數(shù)據(jù)中的冗余信息。采用 MATLAB 神經網絡工具箱建立了加工中心故障類型的智能混合診斷系統(tǒng);研究了智能混合故障診斷系統(tǒng),并進行了功能模塊設計,各功能模塊分別為:數(shù)據(jù)采集模塊,數(shù)據(jù)預處理模塊,數(shù)據(jù)約簡模塊,神經網絡模塊,故障診斷模塊。在此基礎上構建了一個基于粗集—神經網絡
6、的智能混合故障診斷系統(tǒng)。</p><p> 關鍵詞:粗集,神經網絡,故障診斷,虛擬儀器,加工中心</p><p><b> i</b></p><p> 用于加工中心的計算機智能監(jiān)測控制方法研究</p><p> RESEARCH ON COMPUTER INTELLIGENT MONITORING AND CO
7、NTROLING USED FOR MACHINING CENTER</p><p><b> ABSTRACT</b></p><p> With the development of automation and the high demand of reliableness, Machining Center has got important status
8、 and predomination in manufacturing. Machining Center has grown as key and deciding factor in many plants. Without timely fault diagnosis and service, serious economic loss can be caused. Rough Sets theory has made fast
9、progress in recent years, it has outstanding ability in research of expressing, learning , concluding non-precise knowledge. It is based on practical large data sets, </p><p> So this paper studies a method
10、 of Machining Center fault diagnosis based on Rough Sets theory,which is one of the latest tools in Data Mining area. Not like the usual methods that based on mechanical vibrancy, this method combines the Rough Sets theo
11、ry with the Artificial Neural Network.</p><p> The practicality of using rough set to reduce the date was discussed, in this paper, and the interval-valued continuous attribute discretization by applying se
12、lf-organizing map neural network clustering was proposed, too. This article proposes a normal concision 's method, which reduces the example's condition attribute and eliminates the redundant information of the d
13、ate. What's more, it provides the methods used to diagnosis Machining Center's faults based on the intelligence hybrid system by </p><p> KEY WORDS: rough sets, neutral network, fault diagnosis, vir
14、tual instrument, machining center</p><p><b> ii</b></p><p> 河北工業(yè)大學碩士學位論文</p><p><b> 目 錄</b></p><p><b> 第一章緒 論1</b></p>
15、<p> §1-1 故障診斷技術的研究現(xiàn)狀1</p><p> 1-1-1 傳統(tǒng)故障診斷技術1</p><p> 1-1-2 人工智能故障診斷技術1</p><p> 1-1-3 數(shù)據(jù)挖掘在故障診斷中的應用2</p><p> §1-2 數(shù)據(jù)挖掘技術3</p><p>
16、 1-2-1 數(shù)據(jù)挖掘基本知識3</p><p> 1-2-2 數(shù)據(jù)預處理4</p><p> 1-2-3 數(shù)據(jù)挖掘分類5</p><p> §1-3 數(shù)據(jù)挖掘方法和技術6</p><p> 1-3-1 統(tǒng)計學習方法6</p><p> 1-3-2 機器學習方法7</p>
17、<p> 1-3-3 生物技術7</p><p> 1-3-4 數(shù)據(jù)挖掘研究中的技術難題7</p><p> 1-3-5 數(shù)據(jù)挖掘在故障診斷中的應用8</p><p> §1-4 基于粗集的數(shù)據(jù)挖掘8</p><p> §1-5 粗集和神經網絡結合的必要性8</p><p
18、> §1-6 本課題研究的意義及內容10</p><p> 1-6-1 本課題的目的和意義10</p><p> 1-6-2 主要研究內容10</p><p> 第二章粗集在故障診斷中的應用11</p><p> §2-1 粗集理論的基本概念11</p><p> 2-
19、1-1 知識與不可辨識關系11</p><p> 2-1-2 粗集的上近似、下近似及邊界12</p><p> 2-1-3 知識的等價與推廣13</p><p> 2-1-4 知識的簡化13</p><p> 2-1-5 屬性的依賴性和重要性13</p><p> §2-2 連續(xù)數(shù)據(jù)的離散
20、化方法15</p><p> §2-3 粗集數(shù)據(jù)約簡方法16</p><p> 2-3-1 決策表16</p><p> 2-3-2 決策表的約簡17</p><p> §2-4 本章小結20</p><p> 第三章人工神經網絡的應用21</p><p&
21、gt; §3-1 人工神經網絡概述21</p><p> §3-2 神經網絡的特性和學習算法21</p><p> 3-2-1 人工神經網絡的基本特性21</p><p> 3-2-2 人工神經網絡的主要學習算法22</p><p><b> iii</b></p>&
22、lt;p> 用于加工中心的計算機智能監(jiān)測控制方法研究</p><p><b> iv</b></p><p> 河北工業(yè)大學碩士學位論文</p><p><b> 第一章緒 論</b></p><p> §1-1 故障診斷技術的研究現(xiàn)狀</p><p&
23、gt; 故障診斷是根據(jù)設備運行狀態(tài)信息查找故障源,并確定相應決策的一門綜合性的新興科學。故障診斷技術進入二十世紀九十年代以來,以前所未有的勢頭在國內得到了十分迅速的發(fā)展,并在機械、石化、冶金、電力等行業(yè)得到了十分廣泛的應用。隨著現(xiàn)代工業(yè)及科學技術的迅速發(fā)展,工程系統(tǒng)日趨復雜化和自動化,一旦系統(tǒng)出現(xiàn)故障不僅造成嚴重的社會影響和巨大的經濟損失,而且會危及人身安全,從這個意義上說故障診斷可謂任重而道遠。</p><p&g
24、t; 1-1-1 傳統(tǒng)故障診斷技術</p><p> 工業(yè)生產、加工過程中的控制對象常常是復雜的大系統(tǒng),具有滯后、強耦合、參數(shù)時變等嚴重的非線性特征,且其數(shù)學模型太復雜、噪音統(tǒng)計特性不理想,并存在不確定和外部干擾等因素,因而很難得到較準確的在線狀態(tài)估計或參數(shù)估計,從而難以生成殘差;然而,任何一種基于模型的故障診斷方法,都要構造一個與故障有關的殘差,通過對殘差的分析、評估,以實現(xiàn)故障的分離和補償,這使得大多數(shù)基
25、于系統(tǒng)模型的故障檢測與診斷方法在非線性系統(tǒng)中難以實現(xiàn),或在簡化條件下實現(xiàn)也無法實際應用。</p><p> 以傳感器技術和動態(tài)測試技術為基礎,以信息處理技術為手段的現(xiàn)代設備診斷技術經歷了三十多年的發(fā)展與應用,已經取得了明顯的經濟效益。但進一步的理論研究與應用結果表明,由于各種信息檢測手段和診斷方法都將診斷對象看成是一個有機的整體,大多是利用診斷對象所表現(xiàn)出來的特定信號(特征信號)來診斷特定類型的故障,對多故障同
26、時發(fā)生和各種故障之間可能存在的互相聯(lián)系及影響難以分析,并做出相應決策[1]。</p><p> 1-1-2 人工智能故障診斷技術</p><p> 與傳統(tǒng)的基于傳感器技術和信號處理技術的故障診斷相比人工智能故障診斷的優(yōu)越性在于:綜合了多個專家的最佳經驗,功能水平可以達到甚至超過專家水平,實現(xiàn)了人機聯(lián)合診斷,能夠對多故障、多過程和突發(fā)性故障進行快速分類診斷[2]。</p>
27、<p> 人工智能故障診斷已經在電路與數(shù)字電子設備、機電設備等方面得到了應用,但仍存在一些問題 ;領域專家的知識主要依靠知識工程師人工移植,“知識瓶頸”問題難于解決;只能局限在相當窄的領域內,依靠的主要是淺知識,缺乏常識即“知識窄臺階”問題;推理方式與策略不靈活,缺乏適應性,易產生“組合爆炸”、“無窮遞歸”等問題;智能水平低,缺乏自組織、自學習、聯(lián)想記憶和類比推理等功能;對結構性很差的知識難以表達和處理;實時在線診斷性能差。
28、上述的缺點已經使人工智能故障診斷的應用和推廣受到了一定程度的限制。</p><p> 常用故障診斷技術的分類:</p><p> 按故障診斷技術在各個不同工程領域中的應用,其可按如下方法分類:</p><p> 1. 按診斷環(huán)境分有離線人工分析、診斷和在線計算機輔助監(jiān)視診斷,二者要求有很大差別。</p><p><b> 1
29、</b></p><p> 用于加工中心的計算機智能監(jiān)測控制方法研究</p><p> 2. 按監(jiān)測手段分:</p><p> (1)振動監(jiān)測診斷法以機器振動作為信息源,在機器運行過程中,通過振動參數(shù)的變化特征判別機器的運行狀態(tài)。</p><p> (2)噪聲檢測診斷法以機器運行中的噪聲作為信息源,在機器運行過程中,通過噪
30、聲參數(shù)的變化特征判別機器的運行狀態(tài)。其本質上與振動監(jiān)測診斷法是一樣的,因為噪聲主要是由振動產生的。</p><p> (3)溫度檢測診斷法以可觀測的機械零件的溫度作為信息源,在機器運行過程中,通過溫度參數(shù)的變化特征判別機器的運行狀態(tài)。</p><p> (4)壓力檢測診斷法以機械系統(tǒng)中的氣體、液體的壓力作為信息源,在機器運行過程中,通過壓力參數(shù)的變化特征判別機器的運行狀態(tài)。</p
31、><p> (5)聲發(fā)射檢測診斷法金屬零件在磨損、變形、破裂過程中產生彈性波,以此彈性波為信息源,在機器運行過程中,分析彈性波的頻率變化特征判別機器的運行狀態(tài)。</p><p> (6)潤滑油或冷卻液中金屬含量分析診斷法在機器運行過程中,以潤滑油或冷卻液中金屬含量的變化,判別機器的運行狀態(tài)。</p><p> (7)金相分析診斷法某些運動的零件,通過對其表面層金屬
32、顯微組織、殘余應力、裂紋及物理性質進行檢查,研究其變化特征,判別機器設備存在的故障及形成原因。</p><p> 3. 按診斷方法原理分</p><p> (1)頻域診斷法應用頻譜分析技術,根據(jù)頻譜特征變化,判別機器的運行狀態(tài)及故障形成原因。</p><p> (2)時域分析法應用時間序列模型及其有關的特性函數(shù),判別機器的工況狀態(tài)的變化。</p>
33、<p> (3)統(tǒng)計分析法應用概率統(tǒng)計模型及其有關的特性函數(shù),實現(xiàn)工況狀態(tài)監(jiān)視與故障診斷。</p><p> (4)信息理論分析法應用信息理論建立的某些特征函數(shù),在機器運行過程中的變化進行工況狀態(tài)分析和故障診斷。</p><p> (5)模式識別法利用檢測信號,提取對工況狀態(tài)反應敏感的特征量構成模式矢量,設計合適的分類器,判別工況狀態(tài),它是人工智能的技術之一。</p
34、><p> (6)專家系統(tǒng),專家系統(tǒng)是一個人工智能計算機程序,它利用知識和推理過程來解決那些需要大量的人類專家知識才能解決的復雜問題,所用的知識和推理過程可認為是最好的領域專家的專門知識的模型。以此為基礎,可把數(shù)控機床故障診斷專家系統(tǒng)定義為:能以人類專家水平進行數(shù)控機床故障診斷的計算機程序。</p><p> (7)人工神經網絡神經網絡是在生物神經研究成果的基礎上提出的人工智能概念,是對人
35、腦神經組織結構和行為的模擬。它以神經元為信息處理的基本單元,以神經元間的連接弧為信息傳遞通道,多個神經元聯(lián)接而成的網絡結構,具有知識的分布式存儲和并行處理等特點。</p><p> 1-1-3 數(shù)據(jù)挖掘在故障診斷中的應用</p><p> 數(shù)據(jù)挖掘技術是隨著人工智能技術和數(shù)據(jù)庫技術的發(fā)展而興起的,能從大量數(shù)據(jù)中挖掘和發(fā)現(xiàn)有價值的、隱含的知識。目前數(shù)據(jù)挖掘與知識發(fā)現(xiàn)己經被廣泛應用于市場營
36、銷、銀行業(yè)、電信業(yè)、制造業(yè)、保險業(yè)醫(yī)藥業(yè)等各個領域。隨著信息技術的進步以及計算機技術和網絡技術的發(fā)展,故障診斷中采集的數(shù)據(jù)(包括統(tǒng)計數(shù)據(jù)、實驗數(shù)據(jù))可以方便地被收集和存儲在各種數(shù)據(jù)庫中。采用傳統(tǒng)的數(shù)據(jù)分析方法對這些巨量的數(shù)據(jù)進行分析和處理,不僅耗時而且難以有效地挖掘和發(fā)現(xiàn)數(shù)據(jù)中隱含的知識。另一方面,盡管專家系統(tǒng)、智能診斷等方法在故障診斷中得到了廣泛的應用,但專家系統(tǒng)的知識瓶頸以及智能診斷方法所帶來的診斷推理過程解釋困難等問題仍未得到很好
37、的解決。因而數(shù)據(jù)挖掘技術能有效地應用于故障診斷中,并且能克服以往存在的知識獲取瓶頸。因此,將數(shù)據(jù)挖掘技術應用于故障診斷中是必要的,也是可行的[3]。</p><p><b> 2</b></p><p> 河北工業(yè)大學碩士學位論文</p><p> §1-2 數(shù)據(jù)挖掘技術</p><p> 早在 20
38、世紀 80 年代,人們在“物競天擇,適者生存”的大原則下,就認識到“誰最先從外部世界獲得有用信息并加以利用,誰就可能成為贏家”。因此,如何對數(shù)據(jù)與信息快速有效地進行分析、加工、提煉以獲取所需知識,就成為計算機及信息技術領域的重要研究課題。而計算機及信息技術發(fā)展的歷史,也就是數(shù)據(jù)和信息加工手段不斷更新和改善的歷史。</p><p> 隨著數(shù)據(jù)庫技術與應用的日益普及,人們面臨著快速擴張的數(shù)據(jù)海洋,如何有效利用豐富的
39、數(shù)據(jù)海洋所蘊含的寶藏為人類服務,人們所依賴的數(shù)據(jù)分析工具卻無法有效地為決策者提供其決策支持所需要的相關知識,從而形成了一種“豐富的數(shù)據(jù),貧乏的知識”之獨特的現(xiàn)象。為有效解決這一問題,數(shù)據(jù)挖掘技術逐步發(fā)展起來,其迅速發(fā)展得益于目前全世界所擁有的巨大數(shù)據(jù)資源,以及對將這些數(shù)據(jù)資源轉換為信息和知識資源的巨大需求。</p><p> 1-2-1 數(shù)據(jù)挖掘基本知識</p><p> 數(shù)據(jù)挖掘(D
40、ata Mining,簡稱 DM)是從數(shù)據(jù)庫中知識發(fā)現(xiàn)(Knowledge Discovery from Database,簡稱 KDD)的一個重要組成步驟,它是一個從大量數(shù)據(jù)中抽取挖掘出未知的、有價值的模式或規(guī)律等知識的復雜過程[4],如圖 1.1 所示:</p><p> 整個知識挖掘過程是由若干挖掘步驟組成,而 DM 僅是其中的一個主要步驟。整個知識挖掘的主要步驟有:</p><p&g
41、t; 數(shù)據(jù)清洗:其作用就是清除數(shù)據(jù)噪聲和與挖掘主題明顯無關的數(shù)據(jù):</p><p> 數(shù)據(jù)集成:其作用是將來自多數(shù)據(jù)源中的相關數(shù)據(jù)組合到一起;</p><p> 數(shù)據(jù)轉換:其作用是將數(shù)據(jù)轉換為易于進行數(shù)據(jù)挖掘的數(shù)據(jù)存儲形式;</p><p> 數(shù)據(jù)挖掘:它是知識挖掘的一個基本步驟,其作用就是利用智能方法挖掘數(shù)據(jù)模式或規(guī)律知識;模式評估:其作用就是根據(jù)一定評估
42、標準從挖掘結果篩選出有意義的模式知識;</p><p> 知識表示:其作用就是利用可視化和知識表達技術,向用戶展示所挖掘出的相關知識。</p><p> 圖 1.1 知識挖掘全過程示意描述</p><p> Fig. 1.1 Data mining described in the whole course</p><p><b&
43、gt; 3</b></p><p> 用于加工中心的計算機智能監(jiān)測控制方法研究</p><p> 盡管 DM 僅僅是整個知識挖掘過程中的一個重要步驟,但在工業(yè)、媒體、數(shù)據(jù)庫研究領域中,“數(shù)據(jù)挖掘”一詞己被廣泛使用和普遍接受,不加區(qū)分地表示整個知識挖掘過程。DM 就是利用機器學習的方法從數(shù)據(jù)庫中提取有價值知識的過程,它是數(shù)據(jù)庫技術和機器學習兩個學科的交叉領域。數(shù)據(jù)庫技術側重
44、于對數(shù)據(jù)存儲處理的高效率方法的研究,而機器學習則側重于設計新的方法從數(shù)據(jù)中提取知識。同時,DM 與其他學科也有很強的聯(lián)系,如統(tǒng)計學、數(shù)學和可視化技術等。另外,在 KDD 過程中要特別注意的是,數(shù)據(jù)挖掘質量的好壞有兩個影響要素:一是所采用的數(shù)據(jù)挖掘技術的有效性,二是用于采掘的數(shù)據(jù)的質量和數(shù)量。如果選擇了錯誤的數(shù)據(jù)或不適當?shù)膶傩?,或對?shù)據(jù)進行了不適當?shù)淖儞Q,則采掘的結果是不會好的[5]。</p><p> 1-2-
45、2 數(shù)據(jù)預處理</p><p> 由于數(shù)據(jù)庫系統(tǒng)所獲數(shù)據(jù)量的迅速膨脹,導致了現(xiàn)實世界數(shù)據(jù)庫中常常包含許多含有噪聲、不完整、甚至是不一致的數(shù)據(jù)。顯然,對數(shù)據(jù)挖掘所涉及的數(shù)據(jù)對象必須進行預處理,以提高數(shù)據(jù)挖掘對象的質量,并最終達到提高數(shù)據(jù)挖掘所獲模式知識質量的目的。</p><p> 1. 數(shù)據(jù)預處理的基本內容</p><p> 數(shù)據(jù)預處理主要包括:數(shù)據(jù)清洗、數(shù)據(jù)
46、集成、數(shù)據(jù)轉換和數(shù)據(jù)消減。數(shù)據(jù)清洗是指消除數(shù)據(jù)中所存在的噪聲以及糾正其不一致的錯誤:數(shù)據(jù)集成則是指將來自多個數(shù)據(jù)源的數(shù)據(jù)合并到一起構成一個完整的數(shù)據(jù)集:數(shù)據(jù)轉換是指將一種格式的數(shù)據(jù)轉換為另一種格式的數(shù)據(jù);最后數(shù)據(jù)消減是指通過刪除冗余特征或聚類消除多余數(shù)據(jù)。</p><p> 數(shù)據(jù)清洗通常包括:添補遺漏數(shù)據(jù)、平滑噪聲數(shù)據(jù)、識別或去除異常值,以及解決不一致問題。有問題的數(shù)據(jù)將會誤導數(shù)據(jù)挖掘的搜索過程。盡管大多數(shù)數(shù)據(jù)
47、挖掘過程包含有對不完全或噪聲數(shù)據(jù)的處理,但它們并不魯棒且常常將處理重點放在如何避免挖掘出的模式對數(shù)據(jù)過分逼近的描述上。</p><p> 數(shù)據(jù)集成是將來自多個數(shù)據(jù)源的數(shù)據(jù)合并到一起。由于描述同一個概念的屬性在不同數(shù)據(jù)庫取不同的名字,在進行數(shù)據(jù)集成時常常會引起數(shù)據(jù)的不一致或冗余。因此在完成數(shù)據(jù)集成之后,有時需要進行數(shù)據(jù)清洗以便消除可能存在的數(shù)據(jù)冗余[6]。</p><p> 數(shù)據(jù)轉換主要
48、是將數(shù)據(jù)轉換以構成一個適合數(shù)據(jù)挖掘的描述形式。數(shù)據(jù)轉換包含以下處理內容:平滑、合計、泛化、規(guī)格化以及屬性構造。平滑是一種數(shù)據(jù)清洗方法,合計和泛化也可以作為數(shù)據(jù)消減的方法。對于使用基于對象距離的挖掘算法,必須進行數(shù)據(jù)規(guī)格化,將其收縮至特定的范圍內。</p><p> 數(shù)據(jù)消減的目的就是縮小所挖掘數(shù)據(jù)的規(guī)模,但卻不會或基本不影響最終的挖掘結果。數(shù)據(jù)消減的主要策略有以下幾種:數(shù)據(jù)立方合計、維數(shù)消減、數(shù)據(jù)壓縮、數(shù)據(jù)塊消
49、減以及離散化與概念層次生成等。數(shù)據(jù)消減所花費的時間不應該超過由于數(shù)據(jù)消減而節(jié)約的數(shù)據(jù)挖掘時間。</p><p> 以上所提及的各種數(shù)據(jù)預處理方法,并不是相互獨立的,而是相互關聯(lián)的。如:消除數(shù)據(jù)冗余即可以看成是一種形式的數(shù)據(jù)清洗,又可以認為是一種數(shù)據(jù)消減。由于現(xiàn)實世界數(shù)據(jù)常常是含有噪聲、不完全和不一致的,數(shù)據(jù)預處理能夠幫助改善數(shù)據(jù)的質量,進而幫助提高數(shù)據(jù)挖掘進程的有效性和準確性。高質量的決策來自高質量的數(shù)據(jù),因此
50、數(shù)據(jù)預處理是整個數(shù)據(jù)挖掘與知識發(fā)現(xiàn)過程中的一個重要步驟。</p><p><b> 2. 數(shù)據(jù)離散化</b></p><p> 數(shù)據(jù)離散化是數(shù)據(jù)預處理中的一個重要部分,它是一種數(shù)據(jù)消減方式。所謂離散化就是利用取值范圍或更高層次概念來替換初始數(shù)據(jù),將連續(xù)取值屬性的域值范圍分為若干區(qū)間,幫助消減連續(xù)取值屬性的取值個數(shù),對于諸如粗集、決策樹這種主要是用來學習以離散型變量
51、作為屬性類型的學習方法,連續(xù)性變量必須被離散化才能夠被學習[7]。</p><p> 從本質上來看,連續(xù)屬性的離散化過程就是用一定的閾值對屬性空間進行劃分的過程。為了提高機器學習算法的聚類能力和識別能力,離散化過程要求在保證離散化結果性能的前提下防止對屬性空間的過分細化,用盡可能少的斷點將屬性空間劃分成盡可能少的子空間。</p><p> 有效的離散化會顯著地提高系統(tǒng)的聚類能力,增強系
52、統(tǒng)對輸入的待識別樣本中數(shù)據(jù)噪音的魯棒性。</p><p><b> 4</b></p><p> 河北工業(yè)大學碩士學位論文</p><p> 離散化結果將會減小系統(tǒng)對存儲空間的實際需求,加快數(shù)據(jù)挖掘算法的運行速度,減小計算過程的空間開銷。此外,若離散化過程將某一連續(xù)屬性的所有屬性值均映射到同一結果,則該屬性存在與否都不會影響系統(tǒng)對樣本的分
53、辨能力,因而它可以被刪除。從這一角度來說,離散化過程同時也是屬性簡約的過程。</p><p> 有許多學者提出各種離散化方法,其中較為常用的有:人工劃分方法,Bin 方法(包括等距離和等頻率離散化)、基于信息嫡的離散化、布爾推理離散化,Kohonen 網絡離散化、自然/半自然離散算法以及統(tǒng)計檢驗方法。</p><p> 1-2-3 數(shù)據(jù)挖掘分類</p><p>
54、 利用數(shù)據(jù)挖掘技術可以幫助獲得決策所需的多種知識。在許多情況下,用戶并不知道數(shù)據(jù)存在哪些有價值的信息知識,因此對于一個數(shù)據(jù)挖掘系統(tǒng)而言,應該能夠同時搜索發(fā)現(xiàn)多種模式的知識以滿足用戶的期望和實際需要;還應該能夠挖掘出多種層次的模式知識;還應允許用戶來指導挖掘搜索有價值的模式知識。</p><p> 數(shù)據(jù)挖掘是一個多學科交叉領域,這些交叉學科包括:數(shù)據(jù)庫系統(tǒng),機器學習、統(tǒng)計學、可視化和信息科學。此外,因數(shù)據(jù)挖掘任
55、務不同,數(shù)據(jù)挖掘系統(tǒng)也可能采用其他學科的一些技術方法,如神經網絡、模糊邏輯,Rough 集、知識表示、推理邏輯編程或高性能計算等。根據(jù)所挖掘的數(shù)據(jù)或挖掘應用背景,數(shù)據(jù)挖掘系統(tǒng)還可能集成其他領域的一些技術方法,其中包括:空間數(shù)據(jù)分析、信息檢索、模式識別、圖像分析、信號處理、計算機圖形學、互聯(lián)網技術、經濟學、心理學等。正因為數(shù)據(jù)挖掘技術方法的多樣性,也就導致了數(shù)據(jù)挖掘系統(tǒng)的多樣性。而對于數(shù)據(jù)挖掘系統(tǒng)分類也有多種方式。可以根據(jù)所挖掘的數(shù)據(jù)庫進
56、行分類,如按照數(shù)據(jù)類型或數(shù)據(jù)模型進行分類;還可以根據(jù)所使用的技術進行分類,按照用戶交互程度或所使用的數(shù)據(jù)分析方法進行分類。這里按照所挖掘的知識類型對數(shù)據(jù)挖掘系統(tǒng)進行分類。因此可以根據(jù)概念描述知識、對比概念描述知識、關聯(lián)知識、分類知識、聚類知識等進行劃分。</p><p><b> 1. 概念描述</b></p><p> 用戶常常需要抽象的有意義的描述。經過歸納的
57、抽象描述能概括大量的關于類的信息。有兩種典型的描述:特征描述和判別描述。特征描述是從與學習任務相關的一組數(shù)據(jù)中提取出關于這些數(shù)據(jù)的特征式,這些特征式表達了該數(shù)據(jù)集的總體特征;而判別描述則描述了兩個或更多個類之間有何差異</p><p><b> [8]。</b></p><p><b> 2. 關聯(lián)分析</b></p><
58、p> 關聯(lián)分析的目的是發(fā)現(xiàn)特征之間或數(shù)據(jù)之間的相互依賴關系。數(shù)據(jù)相關性關系代表一類重要的可發(fā)現(xiàn)的知識。一個依賴關系存在于兩個元素之間。如果從一個元素 A 的值可以推出另一個元素 B 的值 ,則稱 B 依賴于 A。這里所謂元素可以是字段,也可以是字段間的關系。若兩個或多個數(shù)據(jù)項的取值之間重復出現(xiàn)且概率很高時,它就存在某種關聯(lián),可以建立起這些數(shù)據(jù)項的關聯(lián)規(guī)則[9]。</p><p> 關聯(lián)分析的結果有時可以
59、直接提供給最終用戶。然而,通常強的關聯(lián)關系反映的是固有的領域結構而不是什么新的或有興趣的事物。關聯(lián)知識可被其他模式抽取算法使用。常用技術有回歸分析、機器學習,、信念網絡等。結合領域知識或通過進一步分析,可將關聯(lián)規(guī)則直接用于分類與預測。</p><p><b> 3. 分類與預測</b></p><p> 分類是數(shù)據(jù)挖掘中一項非常重要的任務,其目的是提出一個分類函數(shù)
60、或分類模型(也常常稱作分類器),該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中的某一個。一般使用分類來表示對有限離散屬性值的預測,而預測表示對連續(xù)屬性值的預測。</p><p> 分類器的構造方法有統(tǒng)計方法、機器學習方法、仿生學方法等。統(tǒng)計方法包括貝葉斯法和諸如近鄰學習、基于范例的學習等非參數(shù)法,對應的知識表示則為判別函數(shù)和原型事例。機器學習方法包括決策樹法和規(guī)則歸納法,前者對應的表示為決策樹或判別樹,后者則一般為
61、產生式規(guī)則。粗集方法的知識表示即為產生式規(guī)則,仿生學方法包括神經網絡方法和遺傳算法。神經網絡方法主要是 BP 算法,</p><p><b> 5</b></p><p> 用于加工中心的計算機智能監(jiān)測控制方法研究</p><p> 它的模型表示是前向反饋神經網絡模型,其本質上是一種非線性判別函數(shù)[10]。</p><
62、p><b> 4. 聚類分析</b></p><p> 聚類分析與分類預測方法明顯不同之處在于,后者所學習獲取分類預測模型所使用的數(shù)據(jù)是己知類別歸屬,屬于有教師監(jiān)督學習方法,而聚類分析所分析處理的數(shù)據(jù)均是無事先確定的類別歸屬,屬于無教師監(jiān)督學習方法。</p><p> 聚類分析以“各聚集內部數(shù)據(jù)對象間的相似度最大化和各聚集對象間相似度最小化”作為基本的分析
63、原則,同樣包括統(tǒng)計方法、機器學習方法和神經網絡方法。統(tǒng)計方法主要研究基于幾何距離的聚類,如歐式距離、海明距離等,是一種基于全局比較的聚類,需要考察所有個體才能決定類的劃分?;谏窠浘W絡的聚類主要是自組織特征映射方法,如 AttT 模型、Kohonen 模型等,當給定距離閾值后 ,各樣本按域值進行聚類。而在機器學習領域,距離是根據(jù)概念的描述來確定的,概念聚類方法首先發(fā)現(xiàn)適當?shù)念?,然后再根?jù)每個類形成相應的特征描述[11]。</p&g
64、t;<p> 5. 數(shù)據(jù)挖掘結果的評估</p><p> 一個數(shù)據(jù)挖掘系統(tǒng)在完成一個挖掘算法之后,常常會獲得成千上萬的模式或規(guī)則。在這些規(guī)則中,只會有一小部分是有實際應用價值的。需要對數(shù)據(jù)挖掘步驟所獲得的挖掘結果進行有效的評估,以便最終能夠獲得有實際應用價值的模式或規(guī)則知識。這就給數(shù)據(jù)挖掘提出許多需要解決的問題。</p><p> 首先,使一個模式有價值的因素是什么?對
65、于該問題,評估一個模式是否有意義通常依據(jù)以下四條標準:易于用戶理解;對新數(shù)據(jù)或測試數(shù)據(jù)能夠確定有效程度;具有潛在價值;新奇的。此外,還有一些評價模式價值的客觀標準,這些標準是基于所挖掘出模式的結構或統(tǒng)計特征。另外,結合一些主觀評價措施可有效反映用戶的需求和興趣。許多根據(jù)客觀評價標準是有價值的模式知識卻只是普通的常識知識,而主觀評價標準是建立在用戶對數(shù)據(jù)的信念基礎上的,這些評估標準基于所發(fā)現(xiàn)模式是否是意外的或與用戶信念相悖的,或能夠提供決
66、策支持而確定的。而意料之中的模式是有價值的則是指它能夠幫助確認用戶想要認可的一個假設[5]。</p><p> 其次,一個數(shù)據(jù)挖掘算法能否產生所有有價值的模式?這個問題是指數(shù)據(jù)挖掘算法的完全性。期望數(shù)據(jù)挖掘算法能夠產生所有可能模式是不現(xiàn)實的,實際上一個模式搜索方法可以利用有趣性評價標準來幫助縮小模式的搜索范圍。因此通常只需要保證挖掘算法的完全性就可以了。評估所挖掘模式的趣味性標準對于有效挖掘出具有應用價值的模式
67、知識是十分重要的。這些標準可以直接幫助指導挖掘算法及時消除無前途的搜索路徑,獲取有實際應用價值的模式知識,有效摒棄無意義的模式,提高挖掘的有效性。</p><p> 另外,一個數(shù)據(jù)挖掘算法能否只產生有價值的模式?這是數(shù)據(jù)挖掘算法的一個最優(yōu)化問題。一般當然希望數(shù)據(jù)挖掘算法僅挖掘有價值的模式,但這是一個較為棘手的最優(yōu)化高效搜索問題,至今尚未有好的辦法。</p><p> §1-3
68、 數(shù)據(jù)挖掘方法和技術</p><p> 現(xiàn)有的多種數(shù)據(jù)分析方法從總體上均可歸類到統(tǒng)計學習方法、機器學習方法以及仿生物學方法這三大類中的某一種,在應用上這些方法各有利弊,需要針對具體挖掘問題選擇合適的技術。對于復雜的數(shù)據(jù)挖掘系統(tǒng),還常常采用多種數(shù)據(jù)挖掘技術或整合多種數(shù)據(jù)挖掘技術以彌補不同數(shù)據(jù)挖掘技術所存在的不足。</p><p> 1-3-1 統(tǒng)計學習方法</p><
69、p> 數(shù)據(jù)處理的最初階段就是用人工方法進行統(tǒng)計分析,統(tǒng)計學習方法在數(shù)據(jù)挖掘領域的應用可謂歷史悠久。統(tǒng)計方法是從事物的外在數(shù)量的表現(xiàn)去推斷該事物可能的規(guī)律性。</p><p> 傳統(tǒng)的統(tǒng)計方法在解決機器學習問題中起著基礎性的作用,主要研究漸近理論,即當樣本趨向于</p><p><b> 6</b></p><p> 河北工業(yè)大學碩
70、士學位論文</p><p> 無窮多時的統(tǒng)計性質。它依賴于顯示的基本概率模型,常見的方法有回歸分析、聚類分析、主元分析以及相關分析等。</p><p> 在傳統(tǒng)的統(tǒng)計學習方法基礎上,已經形成多種新型的數(shù)據(jù)分析方法,如基于范例的推理方法直接使用過去的經驗或解法來求解給定的問題。范例推理檢索范例庫,尋找相似范例,并將待解問題添加進范例庫以便將來參考。Naive 貝葉斯和貝葉斯網絡這兩種貝葉
71、斯統(tǒng)計分析方法能夠實現(xiàn)預測、分類等數(shù)據(jù)挖掘任務。新興的支持向量機技術則是建立在計算學習理淪的結構風險最小化原則之上,主要針對兩類分類問題在高維空間中尋找一個超平面作為兩類的分割,以保證最小分類錯誤率,其重要優(yōu)勢在于可處理線性不可分情況[12]。</p><p> 1-3-2 機器學習方法</p><p> 機器學習方法是目前研究的重點,研究成果較多。從采用的技術上看,可分為兩大類:基于
72、決策樹的技術和基于決策規(guī)則的方法[13]。</p><p> 基于決策樹的技術以信息論的原理為基礎建立決策樹,最后獲得的知識表示形式是決策樹,最為著名的方法就是 Quinlan 開發(fā)的 ID3 方法,利用信息增益尋找數(shù)據(jù)庫中具有最大信息量的字段建立決策樹的節(jié)點,再根據(jù)字段的不同取值建立樹的分支,由每個分支的數(shù)據(jù)子集重復建樹的下層節(jié)點和分支的過程,這樣就建立了決策樹。另外,還有一些決策樹方法,如 Assistan
73、t Professional。 IDL 以及 PRISM 等。</p><p> 基于決策規(guī)則的方法又可細分為兩類,一種是在決策樹基礎上加入規(guī)則求取步驟獲得決策規(guī)則的方法,如 CN2 方法、C4.5 方法、AQIS 及其系列版本等;另外一種則是直接具有規(guī)則求取能力的方法 ,</p><p> Rough 集、Fuzzy 集。</p><p> 1-3-3 生物
74、技術</p><p> 仿生物技術典型的方法是神經網絡方法和遺傳算法,這兩種方法己經形成了獨立的研究體系,在數(shù)據(jù)挖掘中發(fā)揮著巨大作用。</p><p> 神經網絡模擬人腦神經元結構,以 MP 和 Hebb 學習規(guī)則為基礎,建立了前饋式網絡、反饋式網絡和自組織網絡。前饋式網絡可用于預測及模式識別,反饋式網絡擅長聯(lián)想記憶和優(yōu)化計算,而自組織網絡極適用于聚類研究[16]。</p>
75、<p> 遺傳算法是按照自然進化原理提出的一種優(yōu)化策略。在求解過程中,通過最好解的選擇和彼此組合,可以期望解的集合將會越來越好。在數(shù)據(jù)挖掘中,遺傳算法能夠用來形成變量間依賴關系假設。</p><p> 1-3-4 數(shù)據(jù)挖掘研究中的技術難題</p><p> 在數(shù)據(jù)挖掘研究和開發(fā)已取得令人矚目的進展的同時,許多尚待解決和完善的課題也擺在了研究者面前。</p>
76、<p> 涉及數(shù)據(jù)的問題包括噪聲數(shù)據(jù)、缺失數(shù)據(jù)、冗余數(shù)據(jù)、海量數(shù)據(jù)以及動態(tài)數(shù)據(jù)等。噪聲數(shù)據(jù)的屬性值是不精確或錯誤的,從而會影響抽取的模式的準確性,造成最終結果的不確定性。缺失值現(xiàn)象尤其在關系數(shù)據(jù)庫中經常發(fā)生,這種情況給發(fā)現(xiàn)、評估和解釋模式帶來了困難,要求知識發(fā)現(xiàn)模型應當具有近似決策能力。而與不完整數(shù)據(jù)相反,給定的數(shù)據(jù)集中可能含有冗余的或者不重要的屬性或對象,從而增加時間空間開銷和結果規(guī)則的復雜度。數(shù)據(jù)庫中數(shù)據(jù)量的迅速增長,
77、是促進數(shù)據(jù)挖掘技術發(fā)展的原因之一,也是數(shù)據(jù)挖掘技術首先要解決的問題。數(shù)據(jù)庫的基本特點是庫中的內容是動態(tài)改變的,所以知識發(fā)現(xiàn)方法應當具有增量式學習的能力。</p><p> 為了能夠有效的從數(shù)據(jù)庫大量的數(shù)據(jù)中抽取模式知識,數(shù)據(jù)挖掘算法必須是高效的和可擴展的,相應數(shù)據(jù)挖掘算法的運行時間是可以預測的并可以接受的。已發(fā)現(xiàn)的知識應能準確描述數(shù)據(jù)庫中的內容,并能用于實際領域。數(shù)據(jù)挖掘系統(tǒng)還應能很好地處理和抑制噪聲數(shù)據(jù)和不希
78、望的數(shù)據(jù),所以要研</p><p><b> 7</b></p><p> 用于加工中心的計算機智能監(jiān)測控制方法研究</p><p> 究度量知識質量的方法。數(shù)據(jù)挖掘應該能夠用高水平語言、可視化表示或其它表示方式來描述所挖掘出的知識,以使用戶更加容易的理解和應用所挖掘出的知識[14]。</p><p> 雖然大多
79、數(shù)數(shù)據(jù)庫是關系型的,但許多實際應用的關系數(shù)據(jù)庫還可能含有復雜的數(shù)據(jù)類型,如結構數(shù)據(jù)和復雜數(shù)據(jù)對象、超文本和多媒體數(shù)據(jù)、空間和時態(tài)數(shù)據(jù)、事務數(shù)據(jù)以及歷史數(shù)據(jù)等,因此一個功能很強的數(shù)據(jù)挖掘系統(tǒng)應能對各種復雜數(shù)據(jù)類型進行挖掘[17]。鑒于數(shù)據(jù)類型的差異和不同的數(shù)據(jù)挖掘目的,針對不同數(shù)據(jù)挖掘任務應當構造專用的數(shù)據(jù)挖掘系統(tǒng)。</p><p> 1-3-5 數(shù)據(jù)挖掘在故障診斷中的應用</p><p>
80、; 數(shù)據(jù)挖掘技術是隨著人工智能技術和數(shù)據(jù)庫技術的發(fā)展而興起的,能從大量數(shù)據(jù)中挖掘和發(fā)現(xiàn)有價值的、隱含的知識。目前數(shù)據(jù)挖掘與知識發(fā)現(xiàn)己經被廣泛應用于市場營銷、銀行業(yè)、電信業(yè)、制造業(yè)、保險業(yè)、醫(yī)藥業(yè)等各個領域[15]。隨著信息技術的進步以及計算機技術和網絡技術的發(fā)展,故障診斷中采集的數(shù)據(jù)(包括統(tǒng)計數(shù)據(jù)、實驗數(shù)據(jù))可以方便地被收集和存儲在各種數(shù)據(jù)庫中。采用傳統(tǒng)的數(shù)據(jù)分析方法對這些巨量的數(shù)據(jù)進行分析和處理,不僅耗時而且難以有效地挖掘和發(fā)現(xiàn)數(shù)據(jù)
81、中隱含的知識。另一方面,盡管專家系統(tǒng)、智能診斷等方法在故障診斷中得到了廣泛的應用,但專家系統(tǒng)的知識瓶頸以及智能診斷方法所帶來的診斷推理過程解釋困難等問題仍未得到很好的解決。因而數(shù)據(jù)挖掘技術能有效地應用于故障診斷中,并且能克服以往存在的知識獲取瓶頸。因此,將數(shù)據(jù)挖掘技術應用于故障診斷中是必要的,也是可行的。</p><p> §1-4 基于粗集的數(shù)據(jù)挖掘</p><p> 智能
82、的、有效的、可擴展的數(shù)據(jù)挖掘方法的研究是當前研究的熱點,涉及數(shù)據(jù)的問題包括海量數(shù)據(jù)、缺失數(shù)據(jù)、冗余數(shù)據(jù)、噪聲數(shù)據(jù)以及動態(tài)數(shù)據(jù)等。粗集理論從新的視角對知識進行了定義;把知識看作是關于論域的劃分,從而認為知識是具有粒度(granularity)的;認為知識的不精確性是由知識粒度太大引起的。為處理數(shù)據(jù)(特別是帶噪聲、不精確或不完備數(shù)據(jù))分類問題提供了一套嚴密的數(shù)學工具,使得對知識能夠進行嚴密的分析和操作。采用粗集理論作為研究知識發(fā)現(xiàn)的工具具有
83、許多優(yōu)點:首先,粗集理論提供了一套數(shù)學方法從數(shù)學上嚴格地處理數(shù)據(jù)分類問題,尤其是當數(shù)據(jù)具有不完備性或不精確性時;其次,粗集理論僅僅分析隱藏在數(shù)據(jù)中的事實,并沒有校正數(shù)據(jù)中所表現(xiàn)的不一致性,而是一般將所生成的規(guī)則分為確定與可能的規(guī)則;第三,粗集理論包含了知識的一種形式模型,這種模型將知識定義為不可區(qū)分關系的一個族集,這就使得知識有了一種清晰的數(shù)學意義,并且可使用數(shù)學方法來分析處理;最后,粗集理論不需要關于數(shù)據(jù)的任何附加知識[18]。<
84、;/p><p> 粗集理論和粗集分析能夠有效地從數(shù)據(jù)中獲取知識,對不一致、不確定和不完整的信息進行推理 ,在保留有用信息的前提下進行數(shù)據(jù)簡約和模式分類,識別以及評估數(shù)據(jù)之間的依賴關系,并且獲得易于理解的規(guī)則呈現(xiàn)給使用者。因此本文利用粗集分析,針對數(shù)據(jù)挖掘領域要處理的不同知識類型,從高效性和可擴展性方面進行了算法研究;面向數(shù)據(jù)挖掘中的數(shù)據(jù)預處理問題。</p><p> §1-5 粗
85、集和神經網絡結合的必要性</p><p> 人工神經網絡是在生物神經研究成果的基礎上提出的人工智能概念,是對人腦神經組織結構和行為的模擬。它以神經元為信息處理的基本單元,以神經元間的連接弧為信息傳遞通道,多個神經元聯(lián)接而成的網絡結構,具有知識的分布式存儲和并行處理等特點。</p><p> 但是基于人工神經網絡的診斷方法也存在著局限性;神經網絡的故障診斷能力是與它的學習樣本</p
86、><p><b> 8</b></p><p> 河北工業(yè)大學碩士學位論文</p><p> 數(shù)量成正比關系的,故障訓練樣本越多,則神經網絡的診斷能力越強,能夠診斷的故障種類就越多,因此一個好的神經網絡故障診斷系統(tǒng),首先需要較多訓練例子用于神經網絡學習才能使網絡收斂,從而得出穩(wěn)定的診斷結果;同時神經網絡的結構復雜程度和訓練時間的多少,也與故障
87、樣本的種類和數(shù)量成正比關系,樣本種類和數(shù)量越多,則神經網絡結構越復雜,達到網絡收斂需要的訓練時間也就越多。也就是說復雜的神經網絡,需要大量的訓練時間才能使網絡收斂,甚至不能收斂;這是一個矛盾的問題,一方面希望有大量的故障樣本用于訓練網絡,使網絡的診斷能力提高,而另一方面卻要求,神經網絡結構不要過于復雜,訓練和診斷時間短一些,使網絡能夠收斂并快速正確的得到診斷結果。這是神經網絡進一步實用化需要解決的一個主要問題。</p>&
88、lt;p> 通常解決這個問題采用的方法是,改進神經網絡的訓練學習算法,提高訓練速度來減少網絡訓練和診斷需要的時間圈;如:有動量的梯度下降法、共軌梯度法、高斯一牛頓法等,但是問題遠未得到完美解決。</p><p> 用于故障診斷的樣本數(shù)據(jù),通常包含了設備很多零部件的技術狀態(tài)信息,很顯然這些信息并不都是必要的。其中很大一部分是冗余的,是由周圍設備或設備自身不同部位的相互影響而產生的信息,或者是本身檢測到的數(shù)
89、據(jù)的重復判據(jù),而這些信息對故障的診斷是沒有用處的,因此有必要去除這些冗余信息,使訓練樣本的到簡化。樣本簡化后,神經網絡需要處理的數(shù)據(jù)量就會大量減少,需要的網絡結構也就沒有那么復雜,同時訓練時間也得到減少,而不影響故障診斷的診斷效果。如何有效去除故障樣本數(shù)據(jù)中的冗余信息就是本文所要研究的主要任務。</p><p> 知識約簡是粗集理論的核心內容之一。利用粗集方法的約簡屬性來簡化樣本的條件屬性,去除其中的冗余信息,
90、可以使神經網絡的訓練樣本數(shù)據(jù)的冗余信息大大減少,只保留得到正確診斷結果必需的數(shù)據(jù),這正是神經網絡所要解決的問題,因此有必要將神經網絡和粗集相結合起來,組成粗集一神經網絡智能混合故障診斷系統(tǒng),來解決神經網絡訓練樣本量和網絡結構之間的矛盾。</p><p> 粗集理論處理的輸入信息可以是不完整、不精確、不確定的定量數(shù)據(jù)或定性語句,并定義條件屬性和決策屬性的依賴關系,即輸入空間與輸出空間的映射關系是通過決策表簡化得到
91、的,通過去除冗余屬性,來實現(xiàn)簡化知識的表達空間維數(shù)。而神經網絡完成輸入空間與輸出空間的映射關系是通過網絡結構、不斷學習和調整,最后,以特定的結構來表達,即沒有顯式函數(shù)表達卻完成了并行處理,同時,具有較好的抑制噪聲干擾的能力和高度的自學習、自組織、容錯性和分布處理能力。</p><p> 因此,采用粗集理論方法和神經網絡方法相結合,利用其各自特點,進行優(yōu)勢互補是非常有意義的。</p><p&g
92、t;<b> 分類結果輸出</b></p><p> 圖 1.2 粗集—神經網絡系統(tǒng)框圖</p><p> Fig. 1.2 Rough sets-neutral network system diagram</p><p><b> 9</b></p><p> 用于加工中心的計算機智能
93、監(jiān)測控制方法研究</p><p> §1-6 本課題研究的意義及內容</p><p> 1-6-1 本課題的目的和意義</p><p> 神經網絡的故障診斷能力的好壞是與它的學習樣本數(shù)量多少成正比關系的;而神經網絡的結構復雜程度和訓練時間的多少,和故障樣本的種類和數(shù)量的多少也是成正比關系的,也就是說診斷能力強,可以適應多故障診斷的神經網絡必然有復雜的
94、網絡結構,并且需要大量的訓練時間才能使網絡收斂,甚至不能收斂;這是一個矛盾的問題,一方面希望有大量的故障樣本用于訓練網絡,使網絡的診斷能力提高,而另一方面卻要求,神經網絡結構不要過于復雜,訓練和診斷時間短一些,使網絡訓練時能夠收斂并且在診斷時能夠快速正確的得到診斷結果。這是神經網絡進一步實用化需要解決的一個首要問題。如何解決這個矛盾正是本課題的主要研究任務。</p><p> 智能混合故障診斷系統(tǒng)是故障診斷領域
95、當今的研究熱點問題,因為故障診斷本身就是一門交叉性很強的學科,不少領域的技術都可以在其中得以應用;單一的診斷方法難以解決故障診斷中的所有問題,并且每種方法都有自身的優(yōu)缺點,因此有必要將多種方法綜合起來,組成混合診斷系統(tǒng),實現(xiàn)各方法的優(yōu)勢互補,使故障診斷技術更加有效實用。如何有效的將各種方法組合起來,實現(xiàn)優(yōu)勢互補是混合系統(tǒng)需要解決的主要問題。將粗集應用在神經網絡的前端,組合成智能混合診斷系統(tǒng),利用粗集對故障樣本進行簡化處理,降低神經網絡結
96、構的復雜度,使神經網絡能夠進一步實用化是本課題的研究意義所在。</p><p> 1-6-2 主要研究內容</p><p> 論文計劃利用粗集的約簡功能對訓練樣本數(shù)據(jù)進行處理,消除樣本數(shù)據(jù)中冗余信息,使訓練樣本的到簡化,同時也就降低了神經網絡結構的復雜程度,解決了上面所提到的影響神經網絡實用化的矛盾。本論文主要解決以下幾個問題:</p><p> 1. 如何將
97、檢測到的連續(xù)數(shù)據(jù)處理成適合粗集理論要求的離散數(shù)據(jù);</p><p> 2. 粗集對決策表實行越簡的方法和算法的實現(xiàn);</p><p> 3. 神經網絡故障診斷系統(tǒng)的程序實現(xiàn);</p><p> 4. 粗集—神經網絡智能混合故障診斷系統(tǒng)的構成和實現(xiàn)。</p><p><b> 10</b></p>&
98、lt;p> 河北工業(yè)大學碩士學位論文</p><p> 第二章粗集在故障診斷中的應用</p><p> 粗集(RoughSet)理論是 Z.Pawlak 在 20 世紀 80 年代提出的用于分析和處理各種不完備信息,從中發(fā)現(xiàn)規(guī)則,揭示潛在規(guī)律的數(shù)學工具。它最顯著的特點是僅利用數(shù)據(jù)本身提供的信息,而不需要其他任何的先驗知識[20,21]。這一理論的提出,為處理故障診斷樣本數(shù)據(jù)中
99、模糊的和不精確的數(shù)據(jù)以及數(shù)據(jù)中的冗余信息的約簡提供了一條全新的途徑。</p><p> 粗集理論處理的輸入信息可以是不完整、不精確、不確定的定量數(shù)據(jù)或定性語句,并定義條件屬性和決策屬性的依賴關系[22,23],即輸入空間與輸出空間的映射關系是通過決策表簡化得到的,通過去除冗余屬性,來實現(xiàn)簡化知識的表達空間維數(shù)。</p><p> 粗集理論具有以下特點[24]:</p>&
100、lt;p> 1. 粗集不需要先驗知識。粗集分析方法僅利用數(shù)據(jù)本身所提供的信息,不需要任何先驗的知識。</p><p> 2. 粗集理論是一個強大的分析工具。它能表達和處理冗余信息;能在保留關鍵信息的前提下對數(shù)據(jù)進行簡化并求得知識的最小表達;能從經驗數(shù)據(jù)中獲取易于證實的規(guī)則知識,特別適合智能控制。</p><p> 3. 粗集在刻劃不完備信息方面,以不可分辨關系為基礎,側重分類。
101、粗集不能清晰定義的原因是缺乏足夠的論域知識,但可以用一對清晰集合逼近。</p><p> 目前,利用粗集理論處理的主要問題包括數(shù)據(jù)庫中的數(shù)據(jù)約簡、數(shù)據(jù)相關性的發(fā)現(xiàn)、數(shù)據(jù)意義的評估、由數(shù)據(jù)產生決策控制算法、數(shù)據(jù)的近似分類、數(shù)據(jù)中的相似性或差異性的發(fā)現(xiàn)、數(shù)據(jù)中范式的發(fā)現(xiàn)以及因果關系的發(fā)現(xiàn)等。</p><p> 粗集經過 20 多年的發(fā)展。正日益受到重視且日趨完善。它逐漸成為數(shù)據(jù)挖掘的一種新
102、的工具。</p><p> §2-1 粗集理論的基本概念</p><p> 2-1-1 知識與不可辨識關系</p><p> 在基于粗集的知識理論中,知識被認為是一種對對象或現(xiàn)實對象進行分類的能力,也即根據(jù)研究對象的屬性特征對對象論域作出分類處理的能力。因此知識是由對象論域的分類模塊組成的,它提供關于現(xiàn)實的明顯事實,同時也具有由明顯事實推導出模糊事實
103、的推理能力。假設給定一對象論域U(Universe),對于任何子集 X U稱為 U 中的一個概念,U 中的任何概念族稱為關于 U 的知識。一</p><p> U 上的分類族定義為一個 U 上的知識庫,它表達了一個或一組智能機構的各種基本分類方式。知識</p><p> 庫可表示為 K= (U, R),其中 R 為 U 上的一個分類(或稱為等價關系),則 U/R 為 R 上的所有等價類
104、</p><p><b> 族[25]。</b></p><p> 識 表達 系 統(tǒng)一 般 表示 為 : S U, C, D, V, f 。其 中 ; U 為所 有 對 象 的 集 合 ,</p><p> x1, x2 ,......, xn ; C 為條件屬性的集合;D 為決策屬性的集合, C D A, A 為屬性集合;&
105、lt;/p><p> Vp , p A,其中 V 是 p 的值域;f: U Vp 為一單射,使論域 U 中任一元素取屬性 p 在 Vp</p><p> 中有唯一確定值。這種知識表達方法實質上為決策表形式描述,其中決策表表頭為設定對象的各類屬性,它的每一行表示論域中的一個成員、實例或稱一條決策規(guī)則,每一列表示屬性及屬性值。如表 2.1 所示的流感信息系統(tǒng),其條件屬性為{頭痛,肌肉痛,
106、體溫},決策屬性為{感冒}[26]。</p><p><b> 11</b></p><p> 用于加工中心的計算機智能監(jiān)測控制方法研究</p><p> 表 2.1 流感數(shù)據(jù)</p><p> Table 2.1 Influenza data</p><p> 不可分辨關系是粗集理論的
107、基石,揭示了論域中知識的顆粒結構,也是定義其他概念的基礎。其</p><p> 概念為:設有決策系統(tǒng) SU, Cd , BC 是條件屬性集合的一個子集,稱二元關系</p><p> IND B, dx, yU U; d xd y 或者 aB, a xa y 為 S 的不可分辨關系,其中,x,</p><p> y 為 U 中的元素。不可分
108、辨關系是一個等價關系,通過一個不可分辨關系,可以得到決策系統(tǒng)的一個劃分,一般稱劃分后的等價類為不可分辨類,可用 X ind B 來表示包含元素 x 的不可分辨類。</p><p><b> 12</b></p><p> 河北工業(yè)大學碩士學位論文</p><p> 是集合 X 的上近似與下近似之差,也就是 U 中即不能肯定歸入集合 X,也
109、不能肯定歸入集合 X 的補集的元素構成的集合。如果 RNR X ,則稱集合 X 為可定義集,簡稱精確集;如果</p><p> RNR X,則稱集合 X 為不可定義集,簡稱粗集。X 的不精確性是由邊界的存在引起的。X 的</p><p> 2-1-3 知識的等價與推廣</p><p> 有兩個知識庫 KU, A 和 K'U, B ,當 ind
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 用于加工中心的計算機智能監(jiān)測控制方法研究.pdf
- 計算機專業(yè)畢業(yè)論文題目-用于合并
- 計算機專業(yè)畢業(yè)論文題目-用于合并
- 計算機畢業(yè)論文范文畢業(yè)論文計算機專業(yè)
- 計算機畢業(yè)論文
- 計算機畢業(yè)論文
- 氧樂果合成計算機智能控制系統(tǒng).pdf
- 計算機畢業(yè)設計---單片機智能小車設計
- 計算機畢業(yè)設計---單片機智能小車設計
- 心電圖的計算機智能分析系統(tǒng).pdf
- 成教計算機畢業(yè)論文
- 計算機 photoshop畢業(yè)論文
- 計算機專業(yè)畢業(yè)論文
- 畢業(yè)論文---計算機專業(yè)
- 畢業(yè)論文??朴嬎銠C
- 計算機學院畢業(yè)論文
- 計算機自考畢業(yè)論文
- 計算機專業(yè)畢業(yè)論文
- 計算機犯罪畢業(yè)論文
- 中專計算機畢業(yè)論文
評論
0/150
提交評論