圖書館與資訊利用期末考(三) @ 有關空大 - 隨意窩
文章推薦指數: 80 %
檢索詞受限於索引典,較無彈性。
7、控制字彙須花費較高成本。
8、使用者必須經過訓練。
... (一)、常用的運算元:布林邏輯、切截、相近運算元、限制欄位。
1、布林邏輯:是 ...
有關空大與您共同分享學長姐們整理的重點或者我自己整理的重點!日誌相簿影音好友名片
201206082316圖書館與資訊利用期末考(三)?文學系第七章
第七章資訊檢索概論一、何謂資訊檢索?(p.159)當資訊需求產生時,將問題轉成關鍵字,由資料庫中找出所需資料的過程。
二、何謂資料庫?(p.159)將資料聚集在一起存放的地方,就可稱為資料庫。
即指利用電腦當做存放處,透過程式的運用來存取利用者。
資料庫包含了非常多的檔案與紀錄,這些紀錄必須藉由欄位來呈現。
不同的資料庫根據收錄內容不同,所規劃的欄位並不完全相同。
資料庫會提供「簡易查詢」與「詳細查詢」兩種模式。
三、資訊儲存與檢索:(p.161)資訊檢索過程包括儲存與檢索兩方面。
資訊儲存指檢索工具與檢索系統的建立。
資訊檢索則指這些檢索工具及檢索系統的利用。
四、檢索語言?(p.162)檢索語言是資訊檢索的工具,是檢索者在進行檢索工作時與系統溝通的管道。
五、何謂索引法?(p.162)由於系統不像人一樣有獨立思考的能力,在建置時,會先內建可供系統在檢索者輸入檢索詞彙時比對的工具,將這個工具稱為「索引法」。
索引法可分為「自然語言」與「控制字彙」二種。
◎六、何謂自然語言?(p.162)自然語言近似我們一般談話使用的語言,而人類語言最合乎人類交談行為的溝通方式,它依循著人類自然進化而發展,成為人和人之間溝通的基本工具,如中文、英文、日文等都是自然語言。
◎七、自然語言的優缺點?(p.163)自然語言是以人類口語話的用詞作為檢索語,可能產生語意不明確、語法不確定的問題。
(一)優點:1、檢索者可直接使用平日熟悉的詞彙進行檢索,字義的表達上較為自由。
2、無需特別的工具及檢索訓練,對於檢索者非常方便。
3、對於很多新的概念,只要系統有收錄,詞彙進去搜尋就可以找到;像是醫學或是科技等新資訊不斷推出的學科,使用自然語言很容易就可以找出相關的資料。
4、系統可自動比對文獻全文,提高檢索的回收率。
5、不需使用控制詞彙,節省系統廠商製作控制字彙的成本。
6、避免索引人員產生的人為錯誤7、不必應付索引典老化所帶來的問題(二)缺點:1、只對字彙進行比對,沒有處理概念的問題,因此一些同義字、類同義字、有層次附屬關係或是文獻中若有隱含概念者,在檢索結果裡無法呈現。
2、僅僅比對字詞,會造成語意不清的情形或斷詞的情形。
3、文獻內涵易被遺漏,檢索結果精確率下降。
4、語意混淆,缺乏統一標準。
◎八、何謂控制字彙(ControlledVocabulary)?(p.163)透過人為加工,對於特定字彙在該系統中賦予其固定意義。
指系統廠商運用一套標準的控制字彙方法,在收錄文獻時,便針對該文獻的內容給予系統內制定的控制字彙,如此一來不論是同義詞、類同義詞、及有層屬概念的文獻都可以檢索出來。
九、控制字彙工具有哪三種?(p.163)最常被使用的有分類表、標題表及索引典三種:-分類表(Classification)-標題表(SubjectHeadings)-索引典(Thesaurus)◎十、控制字彙的優缺點?(p.163)(一)優點:1、使用控制字彙,可改善自然語言所面臨的問題。
2、提高檢索的精確度。
3、能清楚呈現整個主題概念的結構,易從事有階層附屬關係的檢索。
4、透過參見款目功能,可利用參互見,得知相關詞彙讓檢索者在檢索時節省研究詞彙的時間。
5、可解決同義字、類同義字與同形異義字的問題。
6、檢索者負擔輕。
(二)缺點:1、控制字彙的工具更新不易,新概念出現後,無法很快被加入。
必須隨時更新。
2、於分析時被歸入檢索者較意外的概念下,檢索者無法掌握到新概念的資料。
3、需專業人員來設計,索引人員必須具備學科背景與訓練,故製作較慢。
4、檢索者也需要花時間學習其設計的概念。
若對檢索方法不夠瞭解,結果可能不滿意。
5、不同的索引者可能造成索引不一致的問題。
容易因為誤解而產生錯誤或不一致。
品質較難控制。
6、詞彙限於控制工具內,較不具彈性。
檢索詞受限於索引典,較無彈性。
7、控制字彙須花費較高成本。
8、使用者必須經過訓練。
◎十一、精確率與回收率?(p.164)(一)精確率(查準率):(precisionratio)是指被檢索出來的結果中,相關的文獻所佔的比例。
(檢索到相關文章占檢索到文章的比例)(二)回收率(回現率)(查全率):(recallratio)是指在系統中所有相關的文獻被檢索出來的比例。
(是指檢索到相關文章佔所有相關文章的比例)精確率=檢索所得之相關文章筆數/檢索所得之所有書目筆數回收率=檢索所得之相關文章筆數/資料庫中所有相關文章筆數◎十二、資訊檢索技巧有那些?(p.167-174)(一)、常用的運算元:布林邏輯、切截、相近運算元、限制欄位。
1、布林邏輯:是進行檢索工作最基本的運算方式。
布林邏輯運算元有三個:AND、OR、NOT,其不僅可以連結同一個檢索欄位中二個不同的檢索詞彙,還可以針對不同欄位間進行組合檢索。
(1)AND:必須要同時包含被連結的檢索用語,即是所有檢索用語交集的結果。
(2)OR:只要包含其中一個檢索用語,就是檢索用語相互聯集的結果。
(3)NOT:其結果必須要包含前面的檢索用語,但是不能包含在後面的檢索用語,所以檢索用語的前後位置會影檢索結果。
◎例如,以「網路成癮症」與「大學生」這二個主題為例,AND:「網路成癮症AND大學生」,只有同時談到「網路成癮症」與「大學生」的資料(中間交集處)才會被找出來。
OR:「網路成癮症OR大學生」,只要有談到「網路成癮症」或是「大學生」的資料通通都會被找出來。
NOT:「網路成癮症NOT大學生」,則表示,所要找的資料希望是探討網路成癮症,但是內容不要提到大學生。
2、切截:切截可分為左、右、中間切截三種。
最常見的是右切截。
常用的符號為「*」米字號表示中間切,「#」井符號表示前切、「?」問號表示右切等。
3、相近運算元:用在檢索複合詞,相近運算元的概念主要在限制二個字詞間的緊鄰程度,在西文資料庫中較常見,多使用「NEAR」或是「ADJ」來代表。
4、限制欄位:限制欄位,根據資料庫設計的不同,有些是用勾選的方式,有些則是需要自行填入資料。
檢索時可限制欄位條件,以避免檢索資料過多,如:年代、語言、資料類型、線上全文等。
(二)、已知書目檢索:指已經有很明確資料的檢索工作。
(三)、主題檢索:在開始探求某領域知識時,檢索者最常使用主題檢索來探觸該領域,有時藉由主題檢索得到一些基本資料後,再進行已知書目檢索。
(四)、關鍵字檢索(Keywordsearch)只要是與該主題相關的詞彙下去做檢索就可稱為關鍵字檢索。
是主題檢索最常使用的方法,檢索者針對該主題內容直接給定一個詞彙進行檢索。
關鍵字檢索的概念是強調使用與主題相關的詞彙進行的檢索動作。
(五)、引文檢索:其機制是建立於作者在寫文章時參考相關文獻的概念。
透過引文檢索除可瞭解文獻被使用的情形及其後來的發展狀況外,可更進一步瞭解某一主題歷年來的研究結果,進一步推知此學科領域在未來的研究發展趨勢。
還可分析期刊收錄文獻情形,定出學科核心期刊,進而提供研究者作為參考依據。
◎十三、在資訊檢索時,常用到的有那五種資訊檢索策略?(常用的五種檢索模式)?(p.175-183)(一)分區組合檢索法(blockbuilding):將檢索詞分解為幾個不同的主題進行檢索,再在運用布林邏輯組合主題間的關係。
(P.176)(二)引用文獻滾雪球法(citationpearlgrowing):(P.178)1、事先掌握幾篇相關的文章,利用這些相關文章找尋更多相關的文章,就像珍珠或雪球一樣越滾越大。
2、在資訊檢索上的應用:以相關文章的關鍵字或敘述語繼續檢索。
由精確率反向追求回收率。
通常必須進行多次檢索,才能找到足夠的相關文章。
(三)簡易檢索法(briefsearch):(P.178-179)(最常用的檢索策略)1、通常用簡單的幾個關鍵字,加上布林邏輯的組合,檢索快速,回收率低。
2、適用情形:已知書目的檢索、只想閱讀“幾篇”相關文章、檢索概念相當具體時。
(四)主題層面連續檢索法(successivefacetstrategies)(P.179-180)1、與分區組合檢索類似,但分區組合檢索通常會使用所有的主題層面,而主題層面連續檢索則設法動用最少的主題層面。
2、先將檢索問題分成幾個主題層面,再確認各主題層面的優先順序將最專指概念或是可能產生最少資料的概念輸入系統。
3、若產生的資料筆數過多,則輸入其他次要概念與之結合直到檢索者認為檢索筆數可以接受為止。
(五)主題層面配對檢索法(pairwisefacetsstrategies)(P.181-183)1、將主題層面兩兩配對並取其交集(AND)。
2、適用情形:(1)、當所有主題層面都同樣重要時用之。
(2)、所有主題層面之專指性或模糊性相差不大時用之。
(3)、當將所有主題層面交集後,檢索結果為零筆資料時用之。
【補充資料】:如何修正檢索策略:•檢索筆數過多(指誤引過多)•檢索筆數過少(包括零筆資料)•想增加資料回收率(即希望檢索到較多的相關資料)•想增加資料精確率(即希望檢索到正確的所需資料)檢索所得資料過多時:•是否過份簡化問題?•是否需要重新釐清檢索概念?•是否使用了正確的布林邏輯運算元?•是否使用過份含混或一般性之名詞?•是否應考慮使用控制字彙?•是否相近運算元限制過鬆?•是否切截應用過鬆?•是否注意到資料庫的「隱含性概念」?檢索所得資料過少時:•是否使用符合檢索主題的資料庫進行檢索?•是否將問題過於複雜化?•是否真的沒有文獻探討該檢索主題?•是否已使用足夠的檢索詞彙進行檢索?•是否將相近運算元限制過緊?•是否使用正確的布林邏輯(應使用OR而非AND)?•是否拼字或語法有誤?•是否考慮使用自然語言進行檢索?•是否考慮使用切截?想增加資料回收率:(即希望檢索到較多的相關資料)•增加同義詞和類同義詞的數目•使用較廣義的檢索詞彙•以自然語言檢索代替控制詞彙•不使用布林邏輯的”AND”、”NOT”•增加切截的範圍•使用較鬆的相近運算元•刪除一些非主題的欄位限制,例如:年代、資料型態等想增加資料精確率:(即希望檢索到正確的所需資料)•刪除部分類同義詞或是詞義含混的檢索詞彙•使用專指性較高的檢索詞彙•有適當的控制詞彙時,以控制詞彙代替自然語言進行檢索•使用布林邏輯的”NOT”刪除一些不相關的文章•限制切截的範圍pola.huang/Xuite日誌/回應(0)/引用(0)圖書館與資訊利用期末考(二)....|日誌首頁|圖書館與資訊利用期末考(四)....上一篇圖書館與資訊利用期末考(二)...下一篇圖書館與資訊利用期末考(四)...回應
加我為好友日誌相簿影音
pola.huang's新文章不要再笨笨的讓車子被吊走~開車族一定要看!-----網路文章食醋泡腳有五大好處-----網路文章生薑蜂蜜水抑制老年斑----網路文章102下空大二手書明細空大暑修及102學期適用之二手書社會個案工作期末重點整理圖書館資訊與利用期末考重點整理圖書館與資訊利用期末考(五)圖書館與資訊利用期末考(四)圖書館與資訊利用期末考(三)
全部展開|全部收合
pola.huang's新回應沒有新回應!
關鍵字
延伸文章資訊
- 1圖書館與資訊利用期末考(三) @ 有關空大 - 隨意窩
檢索詞受限於索引典,較無彈性。 7、控制字彙須花費較高成本。 8、使用者必須經過訓練。 ... (一)、常用的運算元:布林邏輯、切截、相近運算元、限制欄位。 1、布林邏輯:是 ...
- 2資料庫檢索
控制字彙; precision vs. recall; 布林邏輯運算元; 切截; 相近運算元; Known item search vs. subject search. 資訊儲存與檢索(IS&...
- 3如何快速有效的檢索文獻?
某些資料庫提供相近運算元的檢索,其可限定兩個檢索詞彙出現的順序及位置,例如:使用ABI/INFORM 輸入「nursing W/3 education」則表示nursing 和education...
- 4論文寫作教學--線上檢索技巧 - 國立政治大學圖書館
布林邏輯是線上檢索中最常用的技巧,包括AND、OR、NOT三個基本運算元,可以單獨或配合使用。其中AND表示交集,可設定文件中須同時含有檢索詞彙;OR表示聯集,文件中 ...
- 5線上檢索指令分析--以國立臺灣大學之終端使用者為例 ...
基本上,檢索指導的內容包括:布林邏輯與相近運算元的概念、主題、作者. 與題名檢索的操作、六個基本指令的使用(包含begin: select steps.display.