av手机免费在线观看,国产女人在线视频,国产xxxx免费,捆绑调教一二三区,97影院最新理论片,色之久久综合,国产精品日韩欧美一区二区三区

系統(tǒng)架構(gòu)師

圖書檢索系統(tǒng)體系架構(gòu)研究

時間:2024-09-08 00:25:00 系統(tǒng)架構(gòu)師 我要投稿
  • 相關(guān)推薦

圖書檢索系統(tǒng)體系架構(gòu)研究

  圖書檢索系統(tǒng)可以歸納為索引子系統(tǒng)、檢索子系統(tǒng)、資源匹配子系統(tǒng)和資源子系統(tǒng)四大部分,每一個子系統(tǒng)在整個系統(tǒng)中都有著不可忽視的作用,各個子系統(tǒng)之間統(tǒng)籌合作完成圖書信息的檢索工作。 下面yjbys小編為大家準(zhǔn)備了圖書檢索系統(tǒng)體系架構(gòu)的文章,歡迎閱讀。

圖書檢索系統(tǒng)體系架構(gòu)研究

  1 圖書信息檢索系統(tǒng)評價指標(biāo)

  信息檢索評價是對信息檢索系統(tǒng)性能(主要滿足用戶信息需求的能力)進(jìn)行評估的活動。通過評估可以評價不同技術(shù)的優(yōu)劣,不同因素對系統(tǒng)的影響,從而促進(jìn)本領(lǐng)域研究水平的不斷提高。信息檢索系統(tǒng)的目標(biāo)是在較少消耗的情況下盡快、全面返回準(zhǔn)確的結(jié)果。根據(jù)F.W.Lancaster的闡述,判定一個檢索系統(tǒng)的優(yōu)劣,主要從質(zhì)量、費(fèi)用和時間三方面來衡量。因此,對計算機(jī)信息檢索的效果評價也應(yīng)該從這三個方面進(jìn)行。本文主要研究信息檢索系統(tǒng)的質(zhì)量標(biāo)準(zhǔn),質(zhì)量標(biāo)準(zhǔn)主要通過查全率與查準(zhǔn)率進(jìn)行評價。

  查全率和查準(zhǔn)率是判定檢索效果的主要標(biāo)準(zhǔn),而后兩者相對來說要次要些。

  查全率是指系統(tǒng)在進(jìn)行某一檢索時,檢出的相關(guān)文獻(xiàn)量與系統(tǒng)文獻(xiàn)庫中相關(guān)文獻(xiàn)總量的比率,它反映該系統(tǒng)文獻(xiàn)庫中實(shí)有的相關(guān)文獻(xiàn)量在多大程度上被檢索出來。

  查全率=[檢出相關(guān)文獻(xiàn)量/文獻(xiàn)庫內(nèi)相關(guān)文獻(xiàn)總量]×100% (1)

  查準(zhǔn)率是指系統(tǒng)在進(jìn)行某一檢索時,檢出的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)總量的比率,它反映每次從該系統(tǒng)文獻(xiàn)庫中實(shí)際檢出的全部文獻(xiàn)中有多少是相關(guān)的。

  查準(zhǔn)率=[檢出相關(guān)文獻(xiàn)量/檢出文獻(xiàn)總量]×100% (2)

  查全率與查準(zhǔn)率是評價檢索效果的兩項(xiàng)重要指標(biāo)。查全率和查準(zhǔn)率與文獻(xiàn)的存儲與信息檢索兩個方面是直接相關(guān)的,也就是說,與系統(tǒng)的收錄范圍、索引語言、標(biāo)引工作和檢索工作等有著非常密切的關(guān)系。

  影響查全率的因素:從文獻(xiàn)存儲來看,主要有:文獻(xiàn)庫收錄文獻(xiàn)不全;索引詞匯缺乏控制和專指性;詞表結(jié)構(gòu)不完整;詞間關(guān)系模糊或不正確;標(biāo)引不詳;標(biāo)引前后不一致;標(biāo)引人員遺漏了原文的重要概念或用詞不當(dāng)?shù)取4送,從情報檢索來看,主要有:檢索策略過于簡單;選詞和進(jìn)行邏輯組配不當(dāng);檢索途徑和方法太少;檢索人員業(yè)務(wù)不熟練和缺乏耐心;檢索系統(tǒng)不具備截詞功能和反饋功能,檢索時不能全面地描述檢索要求等。

  影響查準(zhǔn)率的因素:主要有:索引詞不能準(zhǔn)確描述文獻(xiàn)主題和檢索要求;組配規(guī)則不嚴(yán)密;選詞及詞間關(guān)系不正確;標(biāo)引過于詳盡;組配錯誤;檢索時所用檢索詞(或檢索式)專指度不夠,檢索面寬于檢索要求;檢索系統(tǒng)不具備邏輯“非”功能和反饋功能;檢索式中允許容納的詞數(shù)量有限;截詞部位不當(dāng),檢索式中使用邏輯“或”不當(dāng)?shù)鹊取?/p>

  2 信息檢索系統(tǒng)體系架構(gòu)

  一個完整的圖書信息檢索系統(tǒng)應(yīng)當(dāng)包括圖書信息的預(yù)處理,圖書信息的入庫、用戶檢索接口、資源匹配、資源排序等部分,本文主要就以下幾個部分進(jìn)行闡述。

  2.1 索引子系統(tǒng)

  索引子系統(tǒng)主要完成的工作是對圖書信息的入庫工作,圖書館中信息資源具有完整的資源名,然而用戶在搜索時是通過輸入關(guān)鍵字來發(fā)現(xiàn)類似的資源,因此需要對信息資源進(jìn)行預(yù)處理。主要通過對信息資源名構(gòu)建倒排索引,通過建立關(guān)鍵詞和信息資源名之間的鄰接矩陣,如此則完成信息資源和關(guān)鍵詞之間的關(guān)聯(lián)性,用戶可以通過關(guān)鍵詞發(fā)現(xiàn)自身需要的相關(guān)聯(lián)文檔。

  2.2 查詢子系統(tǒng)

  查詢子系統(tǒng)主要提供給用戶查詢接口,用戶通過輸入檢索關(guān)鍵詞,查詢子系統(tǒng)需要對用戶的檢索關(guān)鍵詞進(jìn)行分析,可能用戶輸入的關(guān)鍵詞并非規(guī)范的形式,可能還存在著錯誤信息,或者是以字母形式輸入,或者是以英文或者其它方式輸入,查詢子系統(tǒng)需要對輸入的檢索關(guān)鍵詞進(jìn)行消歧工作。

  2.3 資源匹配子系統(tǒng)

  資源匹配子系統(tǒng)主要根據(jù)用戶的檢索關(guān)鍵詞在圖書館數(shù)據(jù)庫資源中進(jìn)行資源匹配,尋找和用戶相關(guān)聯(lián)的資源,資源匹配的方式有很多種,諸如采用完全匹配方式(即用戶輸入的關(guān)鍵詞和數(shù)據(jù)庫中資源完成匹配)、部分匹配方式(用戶輸入的關(guān)鍵詞中部分信息和數(shù)據(jù)庫中信息匹配成功)、語義匹配方式(用戶輸入的關(guān)鍵詞與數(shù)據(jù)庫中資源存在語義上的關(guān)聯(lián)性)。

  2.4 資源排序子系統(tǒng)

  資源排序子系統(tǒng)主要根據(jù)用戶的檢索關(guān)鍵詞對匹配完成的資源信息進(jìn)行排序,按照資源的重要性和用戶檢索的相關(guān)聯(lián)程度進(jìn)行梯度排序,排序的原則有多種方式,諸如余弦相似度,向量相似度,Jaccard相似度,Dice相似度等多種方式,有些排序子系統(tǒng)根據(jù)現(xiàn)今流行的搜索引擎頁面排序算法進(jìn)行改進(jìn),并將改進(jìn)的排序算法移植于圖書信息檢索系統(tǒng)中。

【圖書檢索系統(tǒng)體系架構(gòu)研究】相關(guān)文章:

紅帽認(rèn)證體系架構(gòu)介紹10-01

流媒體系統(tǒng)架構(gòu)的應(yīng)用07-24

RESTful圖書管理系統(tǒng)架構(gòu)設(shè)計07-11

云計算智能家居系統(tǒng)架構(gòu)研究08-12

云計算醫(yī)療大數(shù)據(jù)系統(tǒng)架構(gòu)研究08-19

MVC架構(gòu)電子文件管理系統(tǒng)研究09-25

光伏儲能電站系統(tǒng)拓?fù)浼軜?gòu)研究08-29

新西蘭留學(xué)研究生關(guān)注的課程體系完整介紹08-28

云計算架構(gòu)技術(shù)與實(shí)踐08-28

托福口語的邏輯架構(gòu)方法10-13