搜文檔
認證信息
認證類型:個人認證
認證主體:常**(實名認證)
IP屬地:河北
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
1、隨著科學技術(shù)特別是信息技術(shù)的迅猛發(fā)展,越來越多的企業(yè)將他們的業(yè)務(wù)交由計算機處理和存儲。各行各業(yè)積累數(shù)據(jù)的能力和速度達到了驚人的地步.因此在商業(yè)領(lǐng)域和科學研究領(lǐng)域都迫切要求發(fā)展這樣一種能夠從如此海量的數(shù)據(jù)中抽取出模式,找出數(shù)據(jù)變化的規(guī)律和數(shù)據(jù)之間的相互依存關(guān)系的技術(shù)?,F(xiàn)在銀行,零售業(yè),等都已經(jīng)開始利用這些前沿的技術(shù)和知識獲取重要信息。不僅如此,利用數(shù)據(jù)挖掘, OLAP技術(shù)、DSS將企業(yè)報表系統(tǒng)和預警系統(tǒng)結(jié)合在一起,形成了當前比較流行的商
2、務(wù)智能(Busirless Intelligerice)軟件。 本文在“起重機監(jiān)測信息的數(shù)據(jù)挖掘與狀態(tài)預測技術(shù)”這個項目的背景下,結(jié)合數(shù)據(jù)挖掘技術(shù)開發(fā)出專門挖掘橋吊監(jiān)測數(shù)據(jù)的挖掘信息系統(tǒng)——QD-Minner。該系統(tǒng)挖掘的對象比較特殊,因為這些對象是安裝在外高橋碼頭的橋吊上二十二個狀態(tài)監(jiān)測點所得到的監(jiān)測數(shù)據(jù)。QD-Minner所挖掘的就是這些監(jiān)測點之間的關(guān)聯(lián)規(guī)則,這些關(guān)聯(lián)規(guī)則反應在數(shù)據(jù)上的就是數(shù)據(jù)庫中列與列之間的關(guān)系。
3、 QD-Minner所使用到的挖掘方法主要基于K-Means和FP-Tree。對于K-Means算法,針對隨機點的不確定性會影響運行效率的問題提出了一些改進;而對于FP-Tree算法,為提高讀取數(shù)據(jù)的速度引進了位圖技術(shù): (1)在實際的K-Means算法中,簇的數(shù)目k是一個不斷改變的變量.因為人們往往不能一次就得到合適的劃分,而是在實驗中不斷更新簇的數(shù)目以尋找最佳的劃分。根據(jù)對K-Means劃分的分析,我們可以看到新的劃分與前
4、一次在k值變化不大的情況下的劃分有相似性,根據(jù)該相似性,提出了基于前一次劃分的BLK-Means算法,該算法避免了隨機選擇質(zhì)點的盲目性,利用前一次得到的劃分結(jié)果計算出較為合理的新的質(zhì)點的分布,減少了迭代的次數(shù),從而降低了運行時間。 (2)FP-Ttree算法在不產(chǎn)生候選項集方面較Apriori算法已有很大改進。本文從數(shù)據(jù)讀取方面入手,結(jié)合位圖的優(yōu)良特性,提出了BMFP算法。該算法主要是將數(shù)據(jù)一次性的讀取并投影為位圖矩陣,使得整個
0/150
提交評論
聯(lián)系客服
本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知眾賞文庫,我們立即給予刪除!
Copyright ? 2013-2023 眾賞文庫版權(quán)所有 違法與不良信息舉報電話:15067167862
復制分享文檔地址
http://www.airport-pavements-failure.com/shtml/view-2769850.html
復制
下載本文檔
評論
0/150
提交評論