

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著網絡技術的飛速發(fā)展,信息快速增長與人們個性化需求的矛盾在不斷地增加,而Web用戶訪問路徑聚類正是解決這一矛盾的有效手段之一。通過對Web用戶訪問路徑聚類,可以發(fā)現用戶興趣、個性及共性特征,可以抽取一段時期內用戶訪問行為特征的分布模式。目前路徑聚類方法,不僅對路徑相似度定義不夠充分,而且聚類算法很難滿足用戶訪問的不確定性、非單一性特點。因此,論文針對Web用戶訪問路徑的聚類方法進行了研究。
首先,為了更好的對Web用戶訪
2、問路徑進行聚類,從系統論的角度出發(fā),提出了一種基于路徑特征差異的相似度計算方法,該方法充分考慮到了頁面訪問中的各種特征。比如,新方法不僅考慮了用戶訪問頁面的時間特征、頻率特征,而且考慮了訪問序列的順序關系以及最長公共子頁面系統特征,因此很大程度地提高了相似度計算的準確性。而且,對比試驗驗證了新方法在實際應用中更科學更合理。
其次,考慮到Web用戶訪問具有不確定性、非單一性的特點,針對這種不確定性聚類,提出了一種高效的模糊可
3、能性聚類算法(FPL:Fuzzy PossibilisticLeader Clustering Algorithm)。該算法在聚類過程中能很好的處理模糊邊界問題。由于結合了模糊集和可能性理論的優(yōu)點,FPL算法在一定程度上能克服噪聲數據或聚類中心的影響。對類特征模糊或類之間具有交叉的數據,通過我們定義的截集自動地將這些數據分到若干個類中,實現了交叉聚類。另外,新方法中減少了閾值使用個數,減少了人為的干預,增加了聚類的客觀準確性。
4、 最后,論文結合Web用戶訪問特點,針對Web用戶訪問路徑聚類分析中普遍存在的對象類別不確定性現象進行了研究。在前面研究工作的基礎上,提出來一種新的Web用戶訪問路徑的可能性模糊聚類新算法。新方法通過定義相關的截集,自動地將對象分配到若干簇中,避免了人工干預,實現了路徑交叉聚類的目的。由于新方法是建立在Leader聚類算法的框架上,只需要掃描數據集一遍使得算法效率大大提高。在標準數據集上的對比試驗表明新算法不僅是有效的,而且效率較高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Web日志中用戶頻繁訪問路徑挖掘算法的研究.pdf
- Web用戶訪問聚類模式研究.pdf
- 基于Web訪問日志的用戶聚類研究.pdf
- 基于用戶訪問興趣的路徑聚類研究.pdf
- 基于用戶訪問路徑的網頁推薦算法研究.pdf
- 基于用戶瀏覽路徑的Web用戶聚類研究.pdf
- 基于Web日志的訪問路徑模式挖掘.pdf
- Web訪問對象軌跡聚類方法研究.pdf
- Web日志中連續(xù)頻繁訪問路徑挖掘算法研究.pdf
- 基于訪問路徑挖掘的Web緩存與預期模型研究.pdf
- 基于用戶Web訪問日志聚類的推薦算法研究與應用.pdf
- 基于路徑相似度的Web用戶模糊聚類算法研究.pdf
- 面向訪問路徑的用戶行為可視化分析工具的設計與實現.pdf
- 基于Web日志挖掘的用戶聚類研究.pdf
- 基于站點訪問矩陣的Web日志聚類方法分析與改進.pdf
- 基于站點訪問矩陣的web日志聚類方法分析與改進
- 基于Web日志的用戶興趣聚類研究.pdf
- 基于模糊聚類的Web訪問模式挖掘.pdf
- 面向用戶興趣的web文檔聚類研究.pdf
- Web用戶瀏覽模式模糊聚類算法的研究.pdf
評論
0/150
提交評論