Behaviors Modeling and Analysis of Big Data from Web Apps Using Machine Learning and Deep Rnn Techniques.pdf_第1頁
已閱讀1頁,還剩82頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、本文提出了一種移動計算的大數(shù)據(jù)服務(wù)應(yīng)用,它是一種基于上下文情境處理網(wǎng)絡(luò)平臺用戶文本數(shù)據(jù)的方法,應(yīng)用數(shù)據(jù)挖掘技術(shù)和深度機(jī)器學(xué)習(xí)技術(shù)來進(jìn)行想法/行為建模和數(shù)據(jù)分析。研究展示了,如何在文本數(shù)據(jù)處理過程中應(yīng)用深度遞歸神經(jīng)網(wǎng)絡(luò)(Deep RNN)算法、機(jī)器學(xué)習(xí)和模式識別,如何進(jìn)行聯(lián)想記憶保存和實驗優(yōu)化,如何通過Python編程建立機(jī)器學(xué)習(xí)庫。在這些工作中,基于深度遞歸神經(jīng)網(wǎng)絡(luò)算法的Python開發(fā)的模型架構(gòu),用來為文本行為模型提供概念支持,通過語

2、境詞特征識別來進(jìn)行總體數(shù)據(jù)分析的行為檢測。
  首先,研究展示了一個web應(yīng)用程序的示例原型,它是可以獲取用戶關(guān)于項目評論等的文本的一個系統(tǒng)(文中稱為行為數(shù)據(jù),可以用于數(shù)據(jù)收集的電子服務(wù)),可以看做行為分析項目的數(shù)據(jù)源。主要研究了深度RNN算法和行為建模概念如何應(yīng)用到這樣的分類數(shù)據(jù)集的行為模式檢測中。通過觀察潛在的上下文特征(詞在文本中的情感屬性),可以與一些行為模式關(guān)聯(lián)起來作為句子/段落/文件/記錄的子集。方法包括:首先,手工數(shù)

3、據(jù)注釋作為標(biāo)簽記錄集的局部思想建模和行為檢測方法。其次,建立向量數(shù)組的詞集(上下文感知特性),然后應(yīng)用深度RNN算法來實現(xiàn)監(jiān)督機(jī)器學(xué)習(xí)技術(shù),此技術(shù)通過檢測這些情景化特征向量的有序發(fā)生來學(xué)習(xí),再構(gòu)建智能的文本形式模型。文本模型應(yīng)該準(zhǔn)確地產(chǎn)生可接受的目標(biāo)預(yù)測,描述了與已知的分類顯著的相似性,在訓(xùn)練算法時通過自動條款推理機(jī)制進(jìn)行行為學(xué)習(xí)。隨后,我們能夠定義適當(dāng)?shù)臄?shù)據(jù)表示(行為建模),在這些數(shù)據(jù)表示和構(gòu)建模型的推斷中學(xué)習(xí)。
  通過執(zhí)行基

4、于機(jī)器學(xué)習(xí)方法,特別是深度RNN學(xué)習(xí),它使用包含上下文保存詞特征的數(shù)值化向量作為數(shù)組輸入,進(jìn)行訓(xùn)練和測試以解釋本文中所提出的方法。第一個文本語料庫是轉(zhuǎn)換成一個矩陣向量即數(shù)組的句子,單詞的數(shù)值化格式(同樣單詞出現(xiàn)的次數(shù))。這些向量通過使用分布式(DM)目標(biāo)詞來預(yù)測詞匯在文檔中的上下文關(guān)系。接下來,深層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法被用來通過計算特征識別功能學(xué)習(xí)向量模式。在神經(jīng)網(wǎng)絡(luò)設(shè)計的多維矩陣中,采用低水平代數(shù)計算優(yōu)化支持差異化的數(shù)學(xué)表達(dá)式。此外,存儲

5、單元元素作為神經(jīng)元單位被定位在網(wǎng)絡(luò)中,用來有效構(gòu)建、存儲和維持確定信號在每個階段的復(fù)現(xiàn)。
  盡管擬議的方法可能適用于廣泛的網(wǎng)頁和移動計算環(huán)境的情況下,但人們更關(guān)注情感數(shù)據(jù)。用案例研究的實驗,使用合成和真實世界數(shù)據(jù)進(jìn)行情感分析(SA);通過特征建模和算法訓(xùn)練得到文本模型,進(jìn)行分析和評估。通過使用可靠的性能指標(biāo)評估,部署了真實行為檢測場景的智能文本模式,最后分析討論了結(jié)果。實驗結(jié)果證明,我的方法實現(xiàn)了準(zhǔn)確、健壯和可靠的解決方案,可以

6、克服以前存在的一些問題。進(jìn)一步,通過比較它與其他流行多分類器算法來測試本算法的有效性,包括:KNN,隨機(jī)森林和消極/積極的分類器算法。初步結(jié)果表明,與其他方法相比這種方法更有效。在研究的過程中,基于如何獲得實用技能和知識提出了一些關(guān)鍵的討論,識別潛在的觀念行為,推導(dǎo)出行為模型,并報告興趣的數(shù)據(jù)分析工作。進(jìn)一步論文給出了特征建模的一些改進(jìn)方法,以維持精確算法設(shè)計及優(yōu)化,同時引入其他數(shù)據(jù)類型來幫助實現(xiàn)更好的系統(tǒng)并避免過多的復(fù)雜度。
 

7、 因此,本文行為建模的研究包括以下四個階段:(1)確定一個行為方面和必要的上下文特征作為文本數(shù)據(jù)。(2)像web-app功能服務(wù)定義的那樣,通過網(wǎng)絡(luò)與云存儲收集來自用戶的上下文數(shù)據(jù)。(3)使用收集的數(shù)據(jù)來執(zhí)行深度機(jī)器學(xué)習(xí),使用最適當(dāng)?shù)臄?shù)據(jù)挖掘工具來分析和陳述事實。(4)評估、驗證和基準(zhǔn)測試等其他工作。本研究為通過提供現(xiàn)實的、理論的和經(jīng)過分析的網(wǎng)頁數(shù)據(jù)來進(jìn)行機(jī)器學(xué)習(xí),使用上下文特征的ML和RNN算法,使用模式分析工具和大數(shù)據(jù)分析進(jìn)行行為建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論