

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、現(xiàn)如今人民物質(zhì)生活水平正在穩(wěn)步提高,越來(lái)越多的人開(kāi)始注重精神層面的提升,旅游已經(jīng)成為人們?nèi)粘P蓍e,放松心情的重要手段。出游前補(bǔ)足功課必不可少,從景點(diǎn)選擇到路線(xiàn)規(guī)劃,從美食特色到當(dāng)?shù)仫L(fēng)俗,這些都是每一個(gè)游客關(guān)心的話(huà)題。在浩瀚的網(wǎng)絡(luò)資源中挑選、制定出一個(gè)出游計(jì)劃往往需要耗費(fèi)游客大量的時(shí)間精力。游記作為人們游玩歸來(lái)的總結(jié),其中不僅記錄著出行者當(dāng)時(shí)的心情,更包含著重要的旅游信息,包括景點(diǎn)簡(jiǎn)介,個(gè)人感受,游玩路線(xiàn),大致花銷(xiāo)等等。為了減少游客出行前
2、的準(zhǔn)備時(shí)間,本文將設(shè)計(jì)并實(shí)現(xiàn)一個(gè)基于游記的垂直搜索引擎系統(tǒng),為游客推薦出行路線(xiàn)和精彩游記。
本論文的主要工作如下:
1)研究了垂直搜索引擎的關(guān)鍵技術(shù)。
首先簡(jiǎn)要介紹了當(dāng)今旅游需求的背景及搜索引擎的發(fā)展?fàn)顩r,根據(jù)搜集方法和服務(wù)方式講解了不同搜索引擎之間的差異。并對(duì)垂直搜索引擎的關(guān)鍵技術(shù)進(jìn)行了研究,主要包括爬蟲(chóng)工作原理及主題爬蟲(chóng)算法,中文分詞算法和倒排索引。然后較為詳細(xì)的介紹了全文搜索引擎Lucene的使用方法
3、,功能結(jié)構(gòu),索引和檢索策略,評(píng)分機(jī)制。
2)設(shè)計(jì)并實(shí)現(xiàn)了一款基于游記的旅游信息垂直搜索引擎系統(tǒng)。
系統(tǒng)主要包含三個(gè)模塊—信息采集模塊,索引模塊,用戶(hù)查詢(xún)模塊。信息集模塊,使用WebMagic爬蟲(chóng)框架,從web頁(yè)面中提取信息,處理成結(jié)構(gòu)化信息存儲(chǔ)在本地;索引模塊,使用全文檢索工具包Lucene對(duì)采集到本地的結(jié)構(gòu)化旅游信息進(jìn)行索引;用戶(hù)查詢(xún)模塊,檢索功能使用Lucene檢索策略,根據(jù)用戶(hù)查詢(xún)對(duì)文檔打分并將結(jié)果返回給用戶(hù),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于主題信息服務(wù)的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Lucene的旅游信息搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 招聘信息垂直搜索引擎系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Java的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 招聘信息垂直搜索引擎的研究與實(shí)現(xiàn).pdf
- 政策信息垂直搜索引擎研究與實(shí)現(xiàn).pdf
- 面向旅游業(yè)的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Lucene的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Hadoop的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于LUCENE的汽車(chē)信息垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Lucene垂直搜索引擎的研究與實(shí)現(xiàn).pdf
- 基于Nutch的垂直搜索引擎研究與實(shí)現(xiàn).pdf
- 垂直搜索引擎的架構(gòu)與實(shí)現(xiàn).pdf
- 電子信息垂直搜索引擎的研究與實(shí)現(xiàn).pdf
- 手機(jī)產(chǎn)品垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Nutch的垂直搜索引擎的分析與實(shí)現(xiàn).pdf
- 高校就業(yè)信息平臺(tái)的垂直搜索引擎實(shí)現(xiàn).pdf
- 基于Nutch的學(xué)校信息垂直搜索引擎的研究與實(shí)現(xiàn).pdf
- 基于垂直搜索引擎技術(shù)的房源信息分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論