基于XML的特色數(shù)據(jù)庫發(fā)布平臺研究.pdf_第1頁
已閱讀1頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著社會經(jīng)濟和科學技術的不斷進步,圖書館通過建設特色數(shù)據(jù)庫提升服務質量,彰顯本館特色,增強可持續(xù)發(fā)展的能力和社會競爭力。特色數(shù)據(jù)庫建設可以為高校、研究所等研究機構提供信息情報支持,更好的為地區(qū)經(jīng)濟發(fā)展服務。
  本文針對我國部分211院校圖書館特色數(shù)據(jù)庫建設情況進行了調查,由于社會經(jīng)濟發(fā)展的需要,當前特色數(shù)據(jù)庫建設發(fā)展迅速,逐步接近國際水平,但仍然存在重復建設、標準不統(tǒng)一、數(shù)據(jù)質量不高、維護不及時等問題。這急需通過建立一套可以統(tǒng)一

2、開發(fā)并發(fā)布特色數(shù)據(jù)庫的系統(tǒng)來解決。雖然現(xiàn)在已經(jīng)出現(xiàn)了類似CALIS這樣的綜合性數(shù)據(jù)庫發(fā)布平臺,但是在專業(yè)化、覆蓋面和功能結構上仍然不能適應特色數(shù)據(jù)庫發(fā)展的需要。
  從CALIS系統(tǒng)的發(fā)展可以看出,特色數(shù)據(jù)庫發(fā)布平臺是一個融合了多種技術的綜合性平臺,具有采集、轉換、編目、瀏覽閱讀、跨庫檢索和數(shù)據(jù)統(tǒng)計分析等功能,是數(shù)字化圖書館功能的延伸。本文選擇特色數(shù)據(jù)庫諸多問題中較為突出的兩個問題進行研究:如何充分利用不同標準的元數(shù)據(jù);如何利用用

3、戶行為日志指導特色數(shù)據(jù)庫建設。
  通過對這兩個問題的深入分析,得出解決方案,完成特色數(shù)據(jù)庫發(fā)布平臺功能模塊的設計。本文針對上述問題,采用XML和聚類分析兩類技術,設計了特色數(shù)據(jù)庫發(fā)布平臺的兩個主要功能部件的模型,完成了以下工作:
  (1)使用XML描述 MARC元數(shù)據(jù),使用RDF描述 DC元數(shù)據(jù);
  (2)使用XLST將已描述的MARC元數(shù)據(jù)轉換為DC元數(shù)據(jù);
  (3)使用DOM樹將包含有DC元數(shù)據(jù)的XM

4、L導入關系數(shù)據(jù)庫;
  (4)設計基于K-means算法的用戶訪問日志的聚類分析;
  (5)根據(jù)聚類分析結果給出圖示,為特色數(shù)據(jù)庫建設提出指導性意見。
  在完成上述工作的過程中,本文著重在以下兩點進行了創(chuàng)新性研究:
  (1)借助 XML的平臺無關性、適合作為數(shù)據(jù)傳遞工具的特性,將大量存在的MARC元數(shù)據(jù)轉換為更適合網(wǎng)絡應用的DC元數(shù)據(jù)。用以解決由于特色數(shù)據(jù)庫建設過程中普遍遇到的元數(shù)據(jù)格式不統(tǒng)一造成的著錄工作

5、量大,建庫效率低,元數(shù)據(jù)資源浪費嚴重,標準不統(tǒng)一,不利于特色資源的共享和未來的發(fā)展的問題。
  (2)如何從數(shù)量巨大,結構離散的特色數(shù)據(jù)庫用戶訪問日志中提煉出可以了解用戶需求,指導特色數(shù)據(jù)庫選題、建設的信息尚在探索中。本文借助 K-means算法聚類速度快、易于實現(xiàn),且適用于文本、圖像特征等多種數(shù)據(jù)的聚類分析的特點,提出了解決方案。
  本文試圖通過這兩個主要功能部件的模型設計,使當前圖書館中使用最為廣泛的兩種元數(shù)據(jù)標準 M

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論