

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著計算機技術、通信技術和網(wǎng)絡技術的迅猛發(fā)展,人們現(xiàn)今主要通過網(wǎng)絡發(fā)表自己對產(chǎn)品的價格、性能和售后等方面發(fā)表主觀性看法、建議以及意見。這些主觀性觀點表達了消費者對產(chǎn)品喜愛或是厭惡等情感傾向。消費者在購買產(chǎn)品之前,通常都會在網(wǎng)上查詢該產(chǎn)品的相關評論以作參考,但受時間和精力的限制,從海量的評論信息中獲取相關信息就變得不甚可行。另外,在實際產(chǎn)品評論中,一種產(chǎn)品可能涉及多篇文檔。而目前大多研究者只針對某類產(chǎn)品評論判斷一篇文檔(句子)所表達產(chǎn)品的
2、整體傾向。如果僅從文檔級或句子級進行情感傾向判別,均不能獲得人們對產(chǎn)品的多個不同品牌在其性能方面的綜合評價。因此,如何有效地,并且最好能自動地對帶有情感色彩的主觀性多文本進行分析、處理、并對其進行歸納和推理,進而發(fā)現(xiàn)和概括相關產(chǎn)品的觀點,這就變得非常的重要。
本文研究主要細分為以下幾方面的工作:
(1)基于本體的觀點特征的抽取及句子整合。
本文利用已建立的領域本體,按照產(chǎn)品性能抽取觀點特征以及其評價詞。本文
3、不進行分詞,直接按照字符的匹配進行抽取。實驗表明,該方法比傳統(tǒng)的分詞后再抽取的結果要好,其F值比之高出55.83%。通過對評價同一對象的句子進行匯總,將評價同一對象的句子看做一個整體來處理,從而將問題轉化為傳統(tǒng)的文檔層面的情感分析問題。對于本體中存在概念之間的關系的觀點特征進行整合,將整合后的特征采用一個“核心詞”來表示。由于各個性能相關的數(shù)據(jù)豐富程度不同,整合后的結果之間有較大的差異?!敖?jīng)濟性”所包含的特征整合掉的較少,“舒適性”經(jīng)過
4、整合后,新特征集的規(guī)模只有原始特征集的40.87%。
(2)按照產(chǎn)品的性能建立非完備的情感信息系統(tǒng),并以此為基礎對特征進行約簡。
由于本文的數(shù)據(jù)是一個存在缺失數(shù)據(jù)的系統(tǒng),因此最終抽取到的特征構成的是一個非完備的系統(tǒng)。對于信息系統(tǒng)中的特征的特征值,本文主要依據(jù)特征其本身的情感傾向值和特征所在句子的情感傾向值這兩方面來綜合計算。本文獲取的觀點特征冗余度高,區(qū)分度差以及存在缺失數(shù)據(jù),必須進行約簡優(yōu)化。本文采用基于差別矩陣的
5、特征約簡算法,去掉那些區(qū)分能力差且特征值稀疏度高的特征。對于關注度較高的“舒適性”,其約簡率為55.32%,約簡掉的特征較多,很大程度上提高了評價對象的相似性,降低了冗余度。
(3)對各性能方面的非完備信息系統(tǒng)的評價對象進行情感聚類。
通過對Web評論文檔的聚類,本文可以得到用戶對產(chǎn)品評價的整體預覽以及產(chǎn)品特性的實際評價狀況。本文采用K-means聚類算法,來對各性能方面的非完備信息系統(tǒng)的評價對象進行情感聚類,而聚類
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 非完備信息系統(tǒng)基于信息熵的約簡.pdf
- 基于不完備信息系統(tǒng)的粗糙集研究.pdf
- 基于評價搭配的產(chǎn)品情感傾向聚類方法研究.pdf
- 基于UCT算法的非完備信息多人軍棋博弈系統(tǒng).pdf
- 基于自動閾值選取的不完備信息系統(tǒng)處理方法.pdf
- 不完備信息系統(tǒng)的屬性約簡算法.pdf
- 基于評價對象抽取的影視劇評論聚類研究
- 基于不完備信息系統(tǒng)的VPRSM的規(guī)則獲取方法研究.pdf
- 基于粗糙集的不完備信息系統(tǒng)知識發(fā)現(xiàn).pdf
- 基于屬性序的不完備信息系統(tǒng)的動態(tài)約簡研究.pdf
- 幾類不完備信息系統(tǒng)的屬性約簡.pdf
- 不完備信息系統(tǒng)的完備化及其上的知識獲取.pdf
- 基于聚類的物流管理信息系統(tǒng)設計與實現(xiàn).pdf
- 基于面向對象技術的信息系統(tǒng)開發(fā).pdf
- 基于粗糙集理論的不完備信息系統(tǒng)知識獲取.pdf
- 基于面向對象技術的地質生態(tài)環(huán)境評價信息系統(tǒng)開發(fā).pdf
- 不完備信息系統(tǒng)的粗糙集模型.pdf
- 聚類樹-基于XML的網(wǎng)絡信息系統(tǒng)中的模式管理結構.pdf
- 基于粗糙集的不完備信息系統(tǒng)知識約簡的研究.pdf
- 基于粗糙集的不完備信息系統(tǒng)的處理方法研究.pdf
評論
0/150
提交評論