基于依存句法分析的中文評價對象抽取和情感傾向性分析.pdf_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著互聯(lián)網(wǎng)的發(fā)展,包含有觀點和評論的文本大量涌現(xiàn)。人們一方面瀏覽別人發(fā)表的評論,一方面不停地分享自己對于某些人或物的觀點和情感。情感分析能夠從互聯(lián)網(wǎng)上的評論文本中挖掘出群體性的觀點,這對于經(jīng)濟發(fā)展、政治決策和個體行為都有著極其重要的指引作用。情感分析分為粗粒度和細粒度兩種,目前粗粒度情感分析取得了不錯的效果,而細粒度情感分析的效果依舊不理想。
  評價對象抽取和情感傾向性分析是細粒度情感分析的一個重要的子任務(wù)。其中,評價對象抽取是

2、該任務(wù)性能提高的瓶頸。針對評價對象抽取主要有四種方法,分別是基于尋找頻繁出現(xiàn)的名詞和名詞短語的抽取方法,利用觀點詞和評價對象的關(guān)系進行抽取的方法,使用有監(jiān)督學(xué)習(xí)進行抽取的方法,使用主題模型進行抽取的方法。目前很多使用觀點詞和評價對象的關(guān)系進行抽取的方法往往難以精準(zhǔn)地抽取出觀點詞真正關(guān)聯(lián)的評價對象,尤其是評價對象與觀點詞不在同一子句中的時候。針對該問題,本文在利用中文評論句子中詞匯間依存關(guān)系的基礎(chǔ)上,通過語義角色標(biāo)注、添加抽取規(guī)則和搜索算

3、法,以提高情感分析的性能。論文的主要工作如下:
  (1)在現(xiàn)有詞典的基礎(chǔ)上,構(gòu)建用于情感分析的情感詞典,包括:正面情緒詞典、負(fù)面情緒詞典、正面評價詞典、負(fù)面評價詞典、觀點引述詞典、虛擬語氣詞典、轉(zhuǎn)折詞典、名詞性情感詞典等。這些詞典主要用于處理評價句中無用成分或只是表達想法、意愿的非評價句對情感分析的干擾,提供語義規(guī)則和傾向性分析需要的詞庫支持。
  (2)在依存句法分析的基礎(chǔ)上,利用語義角色標(biāo)注,添加了一系列的抽取規(guī)則進行

4、情感分析。同時使用了定中短語(定語和中心語組成的短語)替換通常的名詞短語抽取出候選評價對象,用以提高評價對象和觀點詞的抽取精確度。這些規(guī)則主要考慮了中文語義知識、常用句式等對情感分析的影響。實驗結(jié)果表明,在NLP&CC2013的微博評測語料上,添加語義規(guī)則的基于依存句法分析的方法,能夠顯著提高評價對象的抽取性能。
  (3)提出一種評價對象搜索方法,用于改善在只抽取出代詞或句法關(guān)系中無評價對象的情況下,搜索上下文中真正的評價對象的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論