模糊集理論在圖書情報學中的應用

>>>  新興科技、社會發展等人文科學探討  >>> 簡體     傳統


    1 模糊集理論的產生及發展概況
  集合是現代數學最重要的基本概念,集合論是現代數學的基礎。模糊數學理論是近三十年來發展起來的一門新的數學理論,亦是一項新的數學工具,是繼經典數學、統計數學之后的又一新發展。為其做出奠基性貢獻的是美國控制論專家L.A.Zadeh,他于1965年在Information and Control雜志上發表著名論文Fuzzy Sets,提出模糊集概念,奠定了模糊性理論的基礎。
  普通的集合只能描述精確的概念,是一種“非此即彼”的現象。一個元素對于集合來說,要么屬于這個集合,要么不屬于這個集合,不會再出現第三種可能性。如“男人”、“紅色的皮球”、“黑色的汽車”等集合,每個集合都有其確定的概念,其外延是確定的,這個相應集合的元素也十分清楚。相反,如果一個概念的外延邊界是不清楚的,那么這個概念的外延便是個模糊集合,構成這個集合的元素也不清楚了。如“老年人”這個概念就有點模糊,如何準確地確定這個概念的外延就成為問題,58歲的人算不算老人,61歲的某人看起來只有40多歲,屬不屬于老人這個集合,這都不是很好確定的。類似的概念還有高個子、很大、聰明、很小等,而運用模糊集合就可以描述相應的的模糊概念。它可以描述一種“亦此亦彼”的現象。
  由于模糊性理論在處理復雜系統特別是有人干預的系統方面的簡捷與有力,某種程度上彌補了經典數學與統計數學的不足,迅速受到廣泛重視,30多年來,這個領域從理論到應用、從軟技術到硬技術都取得豐碩成果。到20世紀90年代,已形成模糊拓樸學、模糊分析學、模糊邏輯學、模糊控制、模糊模式識別等理論。在應用方面,以模糊控制為代表的模糊工程技術獲得突破性進展,應用研究從工業控制領域進入諸如家電等生活消費品領域,一系列采用模糊控制技術的家用電器如模糊洗衣機、模糊空調等也紛紛問世。由模糊邏輯與人工神經網絡相結合而產生的模糊神經網絡控制首先在美國得到實現,福特公司在發動機廢氣排放、軟懸掛控制系統、動力系統控制、虛擬傳感器等都使用了這一新技術。近年來模糊集理論在圖書情報學領域的應用也越來越多。
    2 模糊集理論在圖書情報學中的應用
  在社會發展的歷史進程中,數學理論在社會各個領域獲得廣泛應用,極大地推動了社會的進步,各種數學理論的應用范圍也遠遠地超出了那些理論創立者的想象空間,模糊集理論也是如此。1993年扎德在回顧模糊集理論的發展歷史時說:當年提出模糊集理論時,原來以為首先將在包括人文科學在內的軟科學研究中發揮作用,后來也估計到可能在一些工業領域得到應用,但是萬萬沒有想到竟在家電行業獲得如此廣泛的成果。
    2.1 模糊集理論在圖書館學中的應用
  我們以圖書館的期刊裝訂為例。每個圖書館都需要裝訂期刊,以便保存資料供讀者查閱,但并不是所訂購的每本期刊都需要裝訂。在作出選擇之前,必須要有統一的標準來評判所有的期刊,才能作出哪些期刊需要裝訂,哪些期刊則不需要裝訂的決定。這些標準包括期刊的丟失率和期刊使用率等,而這些評判的結果都不可能用數字準確清晰地表達出來,但是卻可以運用模糊集理論進行準確地描述和模擬。我們不妨設計這樣一種方法來進行。
  由圖書館組織一個小型的專家委員會,再分成多個由兩名專家組成的專家小組,對某種期刊是否裝訂將從以下三個方面來評判:a.由情報科學協會出版的引文文獻中得到的期刊引文數;b.該期刊的丟失率;c.該期刊的流通率。
  專家委員會的每位成員都必須給每一個變量定出隸屬函數。雖然這些變量都能用客觀的方法來測評,但關系到期刊最終是否裝訂的有關測評結果的解釋卻是主觀性的。當專家們確定隸屬函數后,每種期刊都將按這三個標準來評判,具體操作就變得相當簡單了。最后,每個專家都必須事先做出決定,三個標準里每個標準的相對重要性。在數據采集前,圖書館委員會還須確定每位專家的相對權威性。這樣就可以制定出最需要裝訂的期刊序列。而在這一系列的過程中,許多概念的運用都來自于模糊集理論。
    2.2 模糊集理論在情報檢索中的應用
  至今為止,模糊集理論在圖書情報學中的應用主要在情報檢索領域。在這個領域里最早嘗試模糊集理論的是Tahani和Radecki,最早提出這個論點的是Bookstein,而為模糊集理論在情報檢索中的應用提供理論背景的是Radecki。從傳統方法來看,在情報檢索領域里使用的數學工具主要是布爾代數,幾乎每一個研究書目數據庫的人都習慣于使用布爾算子來控制復雜的研究。而且,布爾代數也是建立在集合論的理論基礎上:每個索引詞都會產生一個檢索文獻的集合,它可以用布爾算子(AND、OR、NOT)連接起來。一個情報檢索系統可以被看作是由一個文獻集合和一個索引詞集合組成,每一個索引詞都對應一個文獻集合,它是整個文獻集合的一個子集,這個子集由索引詞和相關文獻組成。
  在較早的文獻記載里,“相關性”在本質上是一個模糊的概念,并不是一個真正的二分法概念,它已經被用模糊集理論建立的模型所代替。模糊情報檢索系統的工作原理如下:當系統增加文獻時,系統就會產生這些文獻的相關索引詞,每個索引詞都會標出權重,來表示該索引詞與文獻的相關度,標引者會指出該索引詞僅適用于該文獻,而無須做出徹底的是或不是的決定。模糊情報檢索系統的檢索更多的是建立于模糊集代數學基礎上,而不是普通的集合代數。AND、OR和NOT這些布爾算子仍然使用,但這些算子已建立在模糊并、模糊交、模糊非的概念基礎上,而不是完全的等價關系。模糊情報檢索也是對傳統的布爾檢索機制的改進,有很多在布爾檢索里使用的理論基礎和機制仍然有效。與布爾檢索相比,模糊情報檢索有許多優勢:如在索引詞的設置方面比較靈活、輸出也能根據相關度來排序等,但模糊情報檢索也存在著一些缺點:如編制索引的成本持續上漲、許多在布爾檢索中出現的問題在模糊情報檢索中同樣存在等。另外,由于傳統的布爾檢索系統在很多領域中做了大量的工作,致使模糊情報檢索在商業系統中還沒有太多的應用。但是模糊情報檢索在很多與情報檢索相關的領域中還是有較多應用:
  (1)專家系統與人工智能。Gaines和Shaw介紹了專家系統的歷史發展,并且把模糊集理論的概念引入這個領域。Graham還描述了模糊邏輯在商業專家系統中的應用。模糊集理論還在人工智能領域有廣泛的使用,Nauck和Kruse運用醫學數據庫創立了模糊分類規則。
  (2)關系型數據庫的模糊查詢。Motro闡述了一個基于模糊集理論的一個數據庫系統,它提供了一個允許模糊查詢的用戶界面。
  (3)模糊聚類分析。情報檢索里的模糊集算法的運用同樣是一個引人注目的領域,Miyamoto在多次應用的基礎上較好地解釋了該方法,模糊聚類分析適用于普通聚類分析應用的任何情形。
  (4)模糊主題檢索。模糊聚類分析引起了特別的關注,這些類別能組成一個類似詞表的結構。為了應付情報檢索的日益增多查詢需求,在模糊主題方面還要加強研究。
  以上所論述的是一個數學理論——模糊集理論,它能模擬有某種程度的模糊和不確定性的各種情形。模糊集理論在圖書情報學中的應用研究還需要我們圖書情報學研究人員的不懈努力,才能更好地運用模糊集理論來解決圖書情報學研究中出現的各種問題。
  收稿日期:2002-11-19
[from]L1情報資料工作謝志佐/丁天喜20032003本文介紹了模糊集理論的產生及發展概況,闡述了模糊集理論在圖書情報學中,尤其是在情報檢索領域的應用。模糊集理論/圖書情報學/情報檢索謝志佐,男,1969年生,寧波大學圖書館館員。寧波大學圖書館 浙江 315211  丁天喜,男,1958年生,寧波大學圖書館副研究館員。寧波大學圖書館 浙江 315211 作者:[from]L1情報資料工作謝志佐/丁天喜20032003本文介紹了模糊集理論的產生及發展概況,闡述了模糊集理論在圖書情報學中,尤其是在情報檢索領域的應用。模糊集理論/圖書情報學/情報檢索

網載 2013-09-10 21:36:26

[新一篇] 梁啟超“趣味”說的理論構架和現實意義

[舊一篇] 次優理論述評
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表