簡介:第一章信息檢索基本知識,海南熱帶海洋學(xué)院圖書館信息咨詢部,第一章信息檢索基本知識,第四節(jié)信息檢索語言第五節(jié)信息檢索的步驟、方法與途徑第六節(jié)檢索效果及其評價(jià),第四節(jié)信息檢索語言,4.1檢索語言的的概念與作用檢索工具之所以成為檢索工具,在于它的著錄款目是按照一定的排檢方法組織起來的,能夠提供一定的檢索手段。決定檢索工具中大量文獻(xiàn)線索的排檢序列的關(guān)鍵,是以文獻(xiàn)特征進(jìn)行標(biāo)引而得到的文獻(xiàn)的標(biāo)識。在一個(gè)檢索工具或檢索系統(tǒng)中,千千萬萬的文獻(xiàn)著錄款目是根據(jù)其標(biāo)識,或按字順或按邏輯次序一般用號碼或字母表示而編排起來的。標(biāo)識是提示文獻(xiàn)內(nèi)容特征或外表特征的“標(biāo)簽”,是文獻(xiàn)最簡潔的代表,也是文獻(xiàn)檢索所據(jù)以進(jìn)行的“存取點(diǎn)”。,,為了使檢索的過程,即文獻(xiàn)標(biāo)識和信息提問的對比進(jìn)行得順利,二者都需要用一定的語言來加以表達(dá)。只有借助于這種語言,文獻(xiàn)的標(biāo)引人員與檢索人員才能有一個(gè)共同的約定,彼此才能溝通思想。也就是說,文獻(xiàn)存儲時(shí),文獻(xiàn)的內(nèi)外特征按照一定的語言來加以描述,而檢索時(shí)信息提問也按照一定的語言來加以表達(dá)。這種把文獻(xiàn)的存儲與檢索聯(lián)系起來、把標(biāo)引人員與檢索人員聯(lián)系起來以便取得共同理解、實(shí)現(xiàn)交流的語言,就叫做檢索語言。下圖展示了檢索語言在信息存儲和檢索過程中的作用。,,檢索語言在信息存儲與檢察中的作用,4.2檢索語言的分類,描述文獻(xiàn)的有關(guān)特征而分描述外表特征的著者姓名、題名、報(bào)告號、標(biāo)準(zhǔn)號、專利號、檔案號等檢索標(biāo)識描述內(nèi)容特征的主題詞、分類號前者比較直觀,容易理解,以下主要介紹后種。,按檢索標(biāo)識的規(guī)范與否來分,檢索語言可分為人工語言(或受控語言)和自然語言。人工語言ARTIFICIALLANGUAGE是根據(jù)信息檢索的需要而由人工創(chuàng)制的,采用規(guī)范化的詞語CONTROLLEDTERM來專指某個(gè)概念或網(wǎng)羅與之相應(yīng)的概念,可以將同義詞、近義詞、相關(guān)詞、多義詞及縮略詞規(guī)范在一起,包括分類檢索語言分類號、主題檢索語言和代碼檢索語言。自然語言NATURALLANGUAGE檢索用詞是從信息內(nèi)容本身抽取的,主要依賴于計(jì)算機(jī)自動抽詞技術(shù)完成,輔以人工自由標(biāo)引,是非規(guī)范詞UNCONTROLLEDTERM。自然語言包括關(guān)鍵詞KEYWORD、題名、作者、摘要、全文、引文等。,,分類語言分類語言是以號碼為基本字符,用分類號表達(dá)文獻(xiàn)主題概念的檢索語言。按分類號的構(gòu)成原理,分類語言又可分為等級體系分類語言和分析一綜合分類語言。分類法中的類又稱類目,指具有共同屬性的一組文獻(xiàn)資料。文獻(xiàn)分類是按照文獻(xiàn)中所含知識信息的學(xué)科屬性,對文獻(xiàn)進(jìn)行區(qū)分,進(jìn)一步根據(jù)文獻(xiàn)的知識信息內(nèi)容之間的內(nèi)在聯(lián)系組成科學(xué)的分類體系,其目的是將同一學(xué)科或?qū)W科門類的文獻(xiàn)集中在一起,便于從學(xué)科的角度進(jìn)行檢索和利用。,,一部分類法實(shí)質(zhì)上就是一套概念標(biāo)識系統(tǒng)。體系分類法采取對文獻(xiàn)論述的事物概念進(jìn)行層層劃分、層層隸屬的辦法來形成一系列專指的分類標(biāo)識,按照科學(xué)體系將分類標(biāo)識組織成具有隸屬、并列關(guān)系的概念等級標(biāo)識系統(tǒng)。分類法雖然比較具有學(xué)科的系統(tǒng)性,但它所能反映的這種科學(xué)系統(tǒng)性,只是在一定的限度之內(nèi)。現(xiàn)代科學(xué)由于邊緣學(xué)科、交叉學(xué)科的出現(xiàn),各門學(xué)科互相滲透,互相結(jié)合,日益使直線序列的分類法難以反映多元性的知識空間,因而不能確切地代表科學(xué)體系。,,一部完整的分類法一般由以下四個(gè)部分組成①編制說明。主要說明該分類法的編制過程、所依據(jù)的編制原則、類目的設(shè)置和編次的理由,對各種分類問題的技術(shù)處理、使用扣標(biāo)引方法等。②類目表。包括大綱一一基本大類一覽表;簡表基本類日表;詳表一主表,是分類法的主體;輔助表一一一組組標(biāo)準(zhǔn)字目表,用以對主表中列舉的類目進(jìn)行細(xì)分。③索引。是分類法的類日名稱索引,按字順排列,以幫助不熟悉分類法的讀者使用。④附錄。收錄按類檢索時(shí)經(jīng)常要查問的一些參考資料。,,常用分類法介紹我國大部分圖書館通常采用的分類法是中國圖書館圖書分類法簡稱中圖法超鏈內(nèi)容為圖書館主頁簡表,其次是中國科學(xué)院圖書館圖書分類法簡稱科圖法和中國人民大學(xué)圖書館圖書分類法簡稱人大法。美國圖書館最通用的是美國國會圖書館圖書分類法LIBRARYOFCONGRESSCLASSIFICATION,簡稱國會法(LC)和杜威十進(jìn)分類法DEWEYDECIMALCLASSIFICATION,簡稱杜威法DDC。,我國最通用的分類法中國圖書館分法,簡稱中圖法基本結(jié)構(gòu),,,中國圖書館分類法,基本大類22個(gè)基本大類A馬、列、毛、鄧有關(guān)論著B哲學(xué)C社會科學(xué)總論D政治E軍事F經(jīng)濟(jì),G文化、科學(xué)、教育、體育H語言、文字I文學(xué)J藝術(shù)K歷史、地理N自然科學(xué)總論O數(shù)理科學(xué)和化學(xué)P天文學(xué)、地球科學(xué)Q生物科學(xué),,,R醫(yī)藥、衛(wèi)生S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù)U交通運(yùn)輸V航空、航天X環(huán)境科學(xué)Z綜合性圖書,例層層展開,T工業(yè)技術(shù)TP自動化技術(shù)、計(jì)算機(jī)技術(shù)TP3計(jì)算技術(shù)、計(jì)算機(jī)技術(shù)TP31計(jì)算機(jī)軟件TP311程序設(shè)計(jì)、軟件工程TP3111程序設(shè)計(jì)TP31113數(shù)據(jù)庫理論與系統(tǒng)TP311131數(shù)據(jù)庫理論,,,分類號TP31,共找到4786條,TP311程序設(shè)計(jì)軟件工程,,查出1183條,TP311131數(shù)據(jù)庫理論,,查出5種,題名檢索數(shù)據(jù)庫,選擇任意匹配,查出460條題名中含有“數(shù)據(jù)庫”的書刊,但不一定是講數(shù)據(jù)理論的。,主題語言由主題詞匯構(gòu)成,即將自然語言中的名詞術(shù)語經(jīng)過規(guī)范化后直接作為信息標(biāo)識,按一定順序排列,通過參照系統(tǒng)揭示主題概念之間的關(guān)系,也稱主題法。主題語言表達(dá)的概念比較準(zhǔn)確,具有較好的靈活性和專指性,不同的檢索系統(tǒng)、不同的專業(yè)領(lǐng)域可以有各自的主題詞表。,規(guī)范化語言標(biāo)題詞、敘詞例自行車(腳踏車、單車)洋玉(馬鈴薯,土豆)自然語言關(guān)鍵詞計(jì)算機(jī)發(fā)展兩者的比較前者易于查全、查準(zhǔn),但不易加式、用戶不熟悉后者不易查全、查準(zhǔn),但易于加工,讀者使用方便。,中國期刊網(wǎng),選擇2002年農(nóng)業(yè)專輯,用關(guān)鍵詞“馬鈴薯”進(jìn)行檢索,查出223篇,用“馬鈴薯”或“土豆”檢索,查出238篇,不同類型檢索語言的比較文獻(xiàn)的外表特征與文獻(xiàn)是一一對應(yīng)的,即一組外表特征只對應(yīng)一篇唯一的文獻(xiàn),而文獻(xiàn)的內(nèi)容特征與文獻(xiàn)卻是一種模糊的對應(yīng)關(guān)系,即一篇文獻(xiàn)有多個(gè)主題詞(關(guān)鍵詞)或分類號,一個(gè)主題詞(關(guān)鍵詞)或分類號也可對應(yīng)多篇甚至幾百篇文獻(xiàn)。正因?yàn)榇嬖谶@兩種對應(yīng)關(guān)系,使得兩種特征的用途大不相同。利用外表特征只能檢出很少的文獻(xiàn),有時(shí)只用于特定情況下(如已經(jīng)知道作者名等)。利用內(nèi)容特征一次能檢出一批文獻(xiàn),這對研究者來說是極其有用的。,第五節(jié)信息檢索的步驟、方法與途徑,51分析課題52選擇檢索工具53構(gòu)造檢索式,選擇檢索途徑54選定檢索方法55查找文獻(xiàn)線索56索取原始文獻(xiàn),51分析課題,,1、明確檢索目的一般來說,用戶的信息需求和檢索目的包括以下幾類一是需要關(guān)于某一個(gè)課題的系統(tǒng)詳盡的信息二是需要關(guān)于某個(gè)課題的最新信息三是了解一些片斷信息,解決一些具體問題2、明確課題的主題或主要內(nèi)容3、課題涉及的學(xué)科范圍搞清楚課題所涉及的學(xué)科領(lǐng)域,是否是跨學(xué)科研究,以便按學(xué)科選擇信息資源。如有可能,還可以給出相應(yīng)的分類號。4、所需信息的數(shù)量、語種、年代范圍、類型等具體指標(biāo)。,52選擇檢索工具檢索工具的種類繁多,其文獻(xiàn)類型、學(xué)科和專業(yè)的收錄范圍各有側(cè)重,所以根據(jù)課題的檢索要求,認(rèn)真選準(zhǔn)、選全檢索工具十分重要。主要要確定以下幾個(gè)方面是否所有與檢索課題相關(guān)的資源都要進(jìn)行檢索,如果是,則不但考慮要檢索一次文獻(xiàn)和二次文獻(xiàn)的數(shù)據(jù)庫,而且對于網(wǎng)上其他資源,如搜索引攀、分類檢索指南、學(xué)科導(dǎo)航、專題BBS等也要查詢。選擇哪些學(xué)科的信息資源例如查找生物學(xué)方面的信息,則可能會涉及醫(yī)學(xué)方面的信息資源,因此要特別注意跨學(xué)科的問題。選擇哪些語種的信息資源是中文還是西文,或是二者兼顧。,,信息資源覆蓋的年限是否符合需求大多數(shù)數(shù)字信息資源覆蓋的年限都是近二十年的內(nèi)容,因此如果需要更早的資料,就要考慮手工檢索的問題;還有些數(shù)據(jù)庫由于更新速度的原因(例如光盤數(shù)據(jù)庫,或數(shù)據(jù)庫加工的速度不夠快,無法提供最新的信息,也是要考慮的因素,這時(shí)更多是使用其他一些相關(guān)數(shù)據(jù)庫如同一數(shù)據(jù)庫的網(wǎng)絡(luò)版或其他網(wǎng)絡(luò)資源來予以補(bǔ)充。信息資源的特點(diǎn)及其針對性如何要了解已選擇的信息資源的查詢特點(diǎn),是否與自己的信息需求相吻合。例如查詢某個(gè)機(jī)構(gòu)或公司的網(wǎng)頁,使用搜索引擎是最好的,而即使是搜索引擎,各自的特點(diǎn)不同,涵蓋的內(nèi)容也有所側(cè)重和不同;查詢新聞時(shí)事,則可以登錄到一些新聞網(wǎng)站;查找學(xué)位論文,就一定要使用學(xué)位論文數(shù)據(jù)庫,或直接到大學(xué)或?qū)W院的網(wǎng)站上查詢,因?yàn)橛行W(xué)校的學(xué)位論文在網(wǎng)上是提供二次文獻(xiàn)服務(wù)的。,53構(gòu)造檢索式,選擇檢索途徑,例如MEMORYMANAGORMEMORYBLOCKORMEMORYPOOLANDALLOCATANDFREE這是一個(gè)典型的檢索式,在這個(gè)檢索式中,包含了五個(gè)概念,這五個(gè)概念用單元詞或詞組短語表示,它們之間存在著邏輯“與”、邏輯“或”、截詞符、優(yōu)先運(yùn)算的關(guān)系,將這五個(gè)概念用布爾邏輯算符“AND”和“OR”,截詞符“”以及嵌套算符“”連接起來,即是一個(gè)檢索式。,擬好檢索式以后,就要選擇檢索點(diǎn)ACCESSPOINT,即選擇檢索途徑或檢索入口,也稱檢索字段FIELD。檢索途徑主要分以下幾種,54選定檢索方法,55查找文獻(xiàn)線索用已經(jīng)構(gòu)成的檢索提問式,按照相應(yīng)的檢索途徑查找有關(guān)的索引如主題索引、分類索引、作者索引等,通過檢索查到與檢索提問一致的文獻(xiàn)后,就要仔細(xì)閱讀分析文獻(xiàn)的著錄款目,判斷主題內(nèi)容是否符合檢索要求。倘若符合檢索要求,就要準(zhǔn)確記下文獻(xiàn)篇名、著者、來源、文種等著錄事項(xiàng)。這些文獻(xiàn)來源項(xiàng)目是獲得文獻(xiàn)原文的主要線索。如果是利用全文數(shù)據(jù)庫或電子書刊檢索系統(tǒng),則可直接獲取原文。,56索取原始文獻(xiàn),A辯識文獻(xiàn)款目,包括文獻(xiàn)類型、來源、出版物名稱等;B查找原始文獻(xiàn)的收藏單位,先從本單位、本地區(qū)入手,利用館藏目錄和聯(lián)合目錄(聯(lián)網(wǎng)目錄),找到原始文獻(xiàn)收藏單位,即可通過借閱、復(fù)制、館際互借或網(wǎng)上傳送獲得文獻(xiàn)。1、刊名。要把那些為節(jié)省篇幅而采用的刊名縮寫還原成刊名全稱是一個(gè)主要的工作。一般檢索刊物都附有引用出版物一覽表,供查對收錄的出版物全稱之用。若線索來自文后參考文獻(xiàn)或手抄件,可查閱專門的刊名縮寫檢索工具,如期刊刊名縮寫PERIODICALTITLEABBREVIATION。中文、日文、俄文刊名在英文文摘中一律采用拉丁文音譯著錄,故在翻譯時(shí)應(yīng)首先將縮寫刊名還原為全稱,然后查閱有關(guān)音譯轉(zhuǎn)化工具書。2、文獻(xiàn)類型。檢索刊物中收錄的文獻(xiàn)類型大多來自期刊,但也混有其他類型的文獻(xiàn),如圖書、學(xué)位論文(印刷型或縮微型)、會議報(bào)告等等。各種類型的文獻(xiàn)著錄格式上有微小差異,要善于辨認(rèn)出這些區(qū)別。如凡有年份、卷期號的一般是期刊論文,有專利代碼的是專利文獻(xiàn),有出版商簡稱和出版地、出版年的是圖書,有會議類屬詞及會期的是會議報(bào)告等等。檢索刊物前的縮略語及符號一覽可供參考。機(jī)檢可依據(jù)打印單上文獻(xiàn)類型字段中的代碼鑒別出版物類型。3、論文著者的地址。要獲取會議論文、學(xué)位論文、公司報(bào)告以及一些尚未公開發(fā)表的文章的原文,必須獲得論文著者包括團(tuán)體著者的詳細(xì)地址。有的檢索刊物的款目中附有作者的工作單位,可以據(jù)此查閱機(jī)構(gòu)名錄。從著者姓名線索出發(fā),進(jìn)一步查閱履歷型傳記工具書亦有不少幫助。,檢索系統(tǒng)的結(jié)構(gòu)一個(gè)檢索系統(tǒng),要能夠有效的被利用,必須有兩個(gè)部分文獻(xiàn)描述項(xiàng)和索引項(xiàng)。文獻(xiàn)描述項(xiàng)按照檢索系統(tǒng)的簡繁可分為題錄型和文摘型兩類。(1)題錄與文摘題錄是所有的檢索系統(tǒng)都應(yīng)具備的基本內(nèi)容,它包括文獻(xiàn)標(biāo)題、作者、作者工作單位、發(fā)表時(shí)間、文獻(xiàn)來源(期刊、會議、專利等)。有了題錄,讀者就可以方便地獲得原文。摘要(ABSTRACT),也稱文摘,是對一篇文獻(xiàn)的內(nèi)容作的簡略準(zhǔn)確的描述。有些文摘與原文文獻(xiàn)刊登在一起,叫做篇首文摘(HEADINGABSTRACT)。一般比較完整的檢索系統(tǒng)每篇文獻(xiàn)都附有摘要,以工讀者了解與挑選文獻(xiàn)。,(2)索引索引(INDEX)原指一種通常按字順排列,包括特別相關(guān)且被文獻(xiàn)提及的全部項(xiàng)目(主題、人名等)的目錄,它給出每個(gè)項(xiàng)目在文獻(xiàn)中的出處,整個(gè)目錄通常放在文獻(xiàn)后面。檢索系統(tǒng)中的索引是指按文獻(xiàn)的特征(外表、內(nèi)容)依一定的次序?qū)⑽墨I(xiàn)(通常以文摘號)排列起來的目錄,通過它可以得到相關(guān)的文摘。,按照索引款目的不同,可以有各種各樣的索引,如主題詞索引(SUBJECTINDEX)關(guān)鍵詞索引(KEYWORDINDEX)作者索引(AUTHORINDEX、PERSONALAUTHORINDEX)作者工作單位索引(AUTHORAFFLIATIONINDEX)COOPERATEAUTHORINDEX分類號索引(CLASSINDEX)各種號碼索引如專利號索引(PATENTNUMBERINDEX)、報(bào)告號索引(REPORTNUMBERINDEX),整個(gè)檢索系統(tǒng)可用下表示出文獻(xiàn)描述項(xiàng)和索引之間用文摘號相連接,因而讀者可以由索引中的文摘號被指引到文獻(xiàn)描述項(xiàng),從而獲得有關(guān)文獻(xiàn)的詳細(xì)信息。,,61檢索效果的評價(jià)指標(biāo),62提高檢索效果的措施,可以通過以下途徑,要提高檢索效果。(1)選擇好檢索工具。(2)準(zhǔn)確使用檢索語言。(3)善于利用各種輔助索引。(4)提高檢索策略制訂水平。,
下載積分: 6 賞幣
上傳時(shí)間:2024-01-05
頁數(shù): 48
大?。?1.03(MB)
子文件數(shù):