

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、分片式處理器能夠很好地應對納米工藝代芯片設計中存在的功耗、線延遲和設計復雜性問題,充分地利用日益增長的片上晶體管資源以提升應用的性能,但對其上的Cache設計提出了新的要求。一方面,需要有分片式的Cache結構以滿足大量執(zhí)行單元的并發(fā)訪存需求;另一方面,需要有分布式內(nèi)存依賴解析機制以保證分布式的訪存順序。與傳統(tǒng)的全局控制的Cache結構相比,非均勻一致Cache結構(NUCA,Non-Uniform Cache Architecture
2、)能夠滿足上述要求,更好地適應分片式處理器體系結構。本文設計了分片式處理器上的非均勻一致的二級和一級Cache結構,并根據(jù)分片式處理器中特有的訪存特征對非均勻一致的一級Cache的結構進行優(yōu)化,提出了Load本地化執(zhí)行模型,最終評估了模型的性能和開銷。該研究工作對分片式處理器上Cache結構的設計具有一定的指導意義。 本文對非均勻一致二級和一級Cache的設計和優(yōu)化均基于實驗室所研究的分片式處理器-指令級并行核(TPA-PI,T
3、iled Processor Architecture-Processor For ILP)。主要研究成果包括:(1)為TPA-PI設計了非均勻一致二級Cache,設計包括:靜態(tài)數(shù)據(jù)映射方式,片上網(wǎng)絡互連,Cache Bank內(nèi)部結構,Cache事務處理邏輯,以及Cache流水線。并使用C語言編寫了面向硬件實現(xiàn)的TPA-PI的二級Cache模擬器。該部分亦可以作為普適的靜態(tài)非均勻一致Cache的設計實例。(2)針對TPA-PI上非均勻一
4、致一級Cache中存在的Load指令的長路由延遲問題,進行了相關的設計優(yōu)化。首先剖析了結構中的訪存行為特征,并根據(jù)Load指令數(shù)據(jù)端和發(fā)射端不一致的情況,分析其中可能獲得的性能提升潛力,據(jù)此設計了Load本地化執(zhí)行的優(yōu)化模型,并設計了多種拷貝策略和一致性維護策略以控制拷貝和Store廣播的開銷。(3)從功能和時序模擬兩個方面評估了Load本地化執(zhí)行模型的性能和開銷。經(jīng)實驗觀測,基本模型可以獲得平均5.72%的性能提升,拷貝開銷對于Cac
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 分片式處理器上指令調(diào)度器的設計與優(yōu)化.pdf
- 分片式處理器上指令調(diào)度器的設計及優(yōu)化.pdf
- 分片式處理器上謂詞執(zhí)行技術的實現(xiàn)與優(yōu)化.pdf
- 多核處理器Cache一致性研究與設計.pdf
- 分片式處理器一級數(shù)據(jù)緩存的設計與優(yōu)化.pdf
- 分片式處理器體系結構上的超塊優(yōu)化技術.pdf
- 分片式處理器上激進執(zhí)行模型分析.pdf
- 對稱多核處理器中Cache一致性的研究與實現(xiàn).pdf
- 分片式流處理器體系結構.pdf
- 類數(shù)據(jù)流驅(qū)動的分片式處理器上一種超塊優(yōu)化技術.pdf
- 面向大數(shù)據(jù)處理的多核處理器Cache一致性協(xié)議.pdf
- 類數(shù)據(jù)流驅(qū)動的分片式處理器上的編譯及優(yōu)化技術.pdf
- 片上多處理器體系結構中Cache一致性模型研究.pdf
- 一種維護Cache一致性的多核處理器建模研究.pdf
- 分片式處理器上超塊生成器的設計與研究.pdf
- 眾核處理器中Cache一致性機制的動態(tài)可重構設計.pdf
- 分片式流處理器數(shù)據(jù)并行存儲系統(tǒng)的設計與實現(xiàn).pdf
- RISC處理器指令Cache設計及其優(yōu)化.pdf
- 眾核處理器中動態(tài)可重構Cache一致性協(xié)議的研究與實現(xiàn).pdf
- 片上多核處理器末級cache優(yōu)化技術研究
評論
0/150
提交評論