

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、分布式計算是一門計算機科學,它研究如何將計算非常復雜巨大的任務劃分為若干個計算量較小的任務進行處理,然后把這些部分分配給許多計算機進行處理,最后把這些計算結果整合到一起得到最終結果。分布式計算與并行計算有所區(qū)別,它要求處理的任務相互獨立,即使上一個任務的結果出現錯誤,也不會影響下一個任務的處理,同時對最終結果影響不大。因此,分布式計算對實時性要求不高,而且具有良好的容錯性。
分布式計算的多種優(yōu)勢吸引了大量的研發(fā)力量去開發(fā)分布式
2、文件系統(tǒng),比較有影響力的分布式文件系統(tǒng)有Google的GFS、Apache的HDFS等,它們具有擅長處理大量數據的優(yōu)點。然而,Hadoop針對文件處理功能的大量優(yōu)化反而降低了其單純的計算能力。專門針對大規(guī)??茖W計算的軟件框架避免了此類問題,比較成熟的有Google圖算法引擎Pregel、Apache的HAMA等。
HAMA是建立在Hadoop上的分布式并行計算模型,它基于MapReduce和BSP(Bulk Synchrono
3、us Paralle塊同步并行)的實現框架,運行環(huán)境需要關聯Zookeeper、HBase、HDFS組件。采用BSP計算技術最大的好處就是加快迭代速度,在最終輸出可用數據之前迭代過程需要傳遞消息若干次。
與傳統(tǒng)消息傳遞模型相比,HAMA提供一種簡易編程方法。它能通過簡單API為開發(fā)者和研究人員提供基礎平臺。此方法也適用于靈活編程模型和分布式存儲,比如HDFS、Hbase等,因此可以在現有的Hadoop集群上使用HAMA。
4、> 本文分析了一些比較有影響力的分布式系統(tǒng),通過對比各個系統(tǒng)的優(yōu)缺點,引出擅長大規(guī)??茖W計算的編程框架HAMA。本文深入研究BSP模型和HAMA整體框架,將其與當前廣泛應用的Hadoop作對比,通過大量實驗數據分析HAMA和Hadoop的計算性能。為保證實驗的公平性,HAMA和Hadoop都在相同的實驗環(huán)境下運行,在HAMA和Hadoop上實現蒙特卡羅算法,除了Hadoop編程實現MapReduce接口與HAMA編程實現BSP模型接口
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- hama計算平臺的性能研究(1)
- 基于Hadoop和Hama平臺的并行算法研究.pdf
- 云計算平臺性能管理的研究.pdf
- Hama圖并行計算框架中任務槽模型及其對作業(yè)調度性能的影響.pdf
- 群智能算法高性能計算平臺的研究.pdf
- 高性能計算平臺的設計與應用.pdf
- 面向高性能計算平臺的Hadoop框架研究及優(yōu)化.pdf
- 龍芯平臺上高性能計算的性能優(yōu)化關鍵問題研究.pdf
- 墊升平臺水動力性能的CFD計算.pdf
- 并行計算平臺的建立及性能分析.pdf
- 基于HAMA的半監(jiān)督哈希方法研究與應用.pdf
- ibm platform高性能計算平臺在研究云中的應用
- MPI高性能云計算平臺關鍵技術研究.pdf
- 基于異構平臺的并行計算性能可視化研究.pdf
- 面向STORM平臺的云計算調度性能優(yōu)化方法研究與實現.pdf
- 混合異構眾核平臺上的高性能計算金融算法研究.pdf
- 構建高性能公共GPU云計算平臺中通信技術的研究.pdf
- 云計算平臺下分布式緩存系統(tǒng)的性能優(yōu)化研究.pdf
- 基于異構計算平臺的高性能生物數據壓縮算法研究.pdf
- 水利科學高性能并行計算平臺構建.pdf
評論
0/150
提交評論