

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、電子商務在近二十年的蓬勃發(fā)展取得了世人矚目的業(yè)績,并以一種前所未有的方式改變著傳統(tǒng)的商務活動的模式和格局,更深刻地影響著人們對商務的認識和理解,改變著人們的生活和工作方式。隨著網(wǎng)絡規(guī)模在全球的迅猛發(fā)展,InteRNet上的Web站點及網(wǎng)頁數(shù)量在以爆炸性的趨勢增長同時隨著網(wǎng)絡技術(shù)的不斷進步,越來越多的Web數(shù)據(jù)庫需要通過網(wǎng)絡查詢?nèi)肟诓拍苓M行訪問,學術(shù)界稱其為深層網(wǎng)(Deep Web)。經(jīng)相關(guān)研究機構(gòu)和商業(yè)機構(gòu)的調(diào)查,萬維網(wǎng)中深層網(wǎng)的數(shù)據(jù)存
2、儲數(shù)量非常巨大,其中電子商務數(shù)據(jù)占了很大的比重。這些電子商務數(shù)據(jù)具有很高的商用價值。然而由于這些電子商務網(wǎng)站網(wǎng)頁形式與內(nèi)容開發(fā)的獨立性,造成了Web數(shù)據(jù)庫,特別是查詢?nèi)肟诘漠悩?gòu)性。正因為此原因,自動的從電子商務網(wǎng)站中獲取有價值的信息和數(shù)據(jù)變成了一件十分具有挑戰(zhàn)性的任務。
本文針對深層網(wǎng)挖掘中目前還沒有很好解決的如何讓機器從語義上理解深層網(wǎng)中的入口信息問題,充分分析了深層網(wǎng)中電子商務入口中文本標簽和查詢元素之間的關(guān)系以及查詢
3、元素之間的關(guān)系。除此之外,從深層網(wǎng)入口的位置特征、布局特征和顯示特征三個方面分析了深層網(wǎng)入口的視覺特征。通過大量電子商務網(wǎng)站深層網(wǎng)入口的觀察的基礎上得到了一些置信度很高的啟發(fā)式規(guī)則,從而提出了基于深層網(wǎng)入口的可視化特征和本體工具WordNet分析深層網(wǎng)入口元素的語義關(guān)系來更好的挖掘出人們易于理解的深層網(wǎng)入口語義層次結(jié)構(gòu)的方法。該方法首先需要對深層網(wǎng)入口頁面數(shù)據(jù)進行預處理。然后,利用基于可視化特征的頁面分割算法構(gòu)建可視化模塊樹并利用可視化
4、對樹中的文本信息進行聚類及標簽信息的識別。最后充分利用深層網(wǎng)入口中的標簽信息間的語義關(guān)系構(gòu)建出合理的標簽樹并通過查詢元素與標簽之間的視覺特征關(guān)系對標簽樹和查詢元素進行匹配,從而提高了挖掘語義信息的準確度,進而提高了深層網(wǎng)信息的獲取效率和覆蓋率。此外本研究利用UIUC網(wǎng)站提供的研究數(shù)據(jù)對提出的方法進行了準確度的實驗,實驗表明,相對于以往的深層網(wǎng)入口挖掘方法,本文提出的方法在準確性方面具有更好的表現(xiàn)。最后對本研究進行了總結(jié),并提出了未來繼續(xù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向旅游電子商務的數(shù)據(jù)挖掘研究.pdf
- 面向電子商務的WEB數(shù)據(jù)挖掘研究.pdf
- 面向電子商務的Web數(shù)據(jù)挖掘的研究.pdf
- 面向電子商務的數(shù)據(jù)挖掘研究與應用.pdf
- 面向電子商務的Web數(shù)據(jù)挖掘應用研究.pdf
- 面向電子商務的Web數(shù)據(jù)挖掘技術(shù)的研究.pdf
- 面向電子商務的Web使用模式數(shù)據(jù)挖掘研究.pdf
- 面向電子商務的web挖掘中關(guān)聯(lián)算法的研究.pdf
- 面向電子商務的數(shù)據(jù)挖掘技術(shù)研究與實現(xiàn).pdf
- 面向電子商務粗分析理論數(shù)據(jù)挖掘方法研究.pdf
- 面向電子商務的數(shù)據(jù)挖掘系統(tǒng)的研究與設計.pdf
- 面向電子商務的web數(shù)據(jù)挖掘的研究與設計.pdf
- 面向電子商務海量數(shù)據(jù)的智能挖掘技術(shù)研究.pdf
- 面向智能電子商務的Web挖掘理論與方法的研究.pdf
- 面向電子商務的數(shù)據(jù)挖掘中聚類算法的研究.pdf
- 面向電子商務個性化推薦的序列關(guān)聯(lián)挖掘研究.pdf
- 面向電子商務信用管理的研究.pdf
- 面向電子商務個性化服務的Web挖掘應用研究.pdf
- 電子商務潛在客戶挖掘.pdf
- 電子商務公司W(wǎng)eb數(shù)據(jù)挖掘研究.pdf
評論
0/150
提交評論