非完備信息機器博弈中風險及對手模型的研究.pdf_第1頁
已閱讀1頁,還剩145頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、人工智能是計算機領域的一個重要分支,其任務是研究使計算機勝任原本必須人的智力才能完成的工作。機器博弈作為人工智能的研究領域之一,是檢驗其發(fā)展水平的一個重要手段。它的研究為人工智能帶來了很多方法和理論,產生了廣泛的社會和學術影響。
  完備信息和非完備信息機器博弈是機器博弈領域的兩個分支。非完備信息博弈的特點是博弈者在博弈過程中無法獲得全部以及可信的局面信息。在非完備信息博弈中,博弈環(huán)境的真實狀態(tài)往往是不可知的,參與其中的博弈者所掌

2、握的信息是不對稱和不完備的,這使得非完備信息博弈的研究更為復雜,更具有挑戰(zhàn)性。
  相對于完備信息機器博弈,非完備信息機器博弈問題中的參與者因信息的不完備,策略選擇面臨必然的風險損失。同時,博弈者行為的個性化和非最優(yōu)化的特點使之在策略選擇中趨向不同的納什均衡。實現有競爭力、高水平的非完備信息機器博弈系統(tǒng),需要對以上問題展開分析,并尋求可行的解決方案。
  本文研究非完備信息機器博弈系統(tǒng)中風險模型及對手模型。研究的具體問題包括

3、:大規(guī)模博弈樹搜索,風險損失的評估與規(guī)避方法,對手建模。
  非完備信息條件決定了此類問題形成的博弈樹規(guī)模非常巨大。蒙特卡洛博弈樹搜索方法(MCTS:Monte-Carlo Tree Search)是解決大規(guī)模博弈樹搜索的基本方法。UCT(Upper Confidence Bound Applied to Trees)算法為博弈樹搜索過程中的分支選擇過程提供了多種策略。本文實現了基于MCTS和UCT策略的非完備信息機器博弈系統(tǒng)策略

4、選擇方法。對不同的UCT算法策略進行分析和比對實驗,討論了UCT策略在博弈問題中的參數調整方法。
  非完備信息條件下,博弈者策略的預期收益與實際收益往往會產生偏差。其原因來自于對自身博弈環(huán)境判斷的不準確性以及對對手行為預測的不準確性。本文提出博弈問題中的風險損失定義和估算方法。同時,結合UCT策略的置信搜索思想,提出了兩者相結合的UCT-Risk策略。在實驗中,該策略被證實在高風險特征的博弈問題中具有更好的效果。最后,提出了系統(tǒng)

5、的風險策略選擇模型。
  由于博弈信息的非完備性和不對稱性,非完備信息博弈者趨向于不同的納什均衡。建立對手模型,分析對手的個性化及聚類特征,建立更為高效的策略選擇模型是近年來機器博弈領域的研究方向。本文還研究了對手建模的理論和算法,特別提出在棋盤類博弈游戲中的理論和應用方法。
  本文對對手建模過程中的對手聚類問題進行了深入探討。使用KL(Kullback-Leibler)距離作為數據個體的聚類標準,提出了改進的群組聚類對手

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論