中國情報檢索語言50年研究論綱

>>>  新興科技、社會發展等人文科學探討  >>> 簡體     傳統


  分類號 G354.2
  CLASS NUMBER G354.2
      1 引言
  50年來,我國情報檢索語言研究日益繁榮,情報語言學逐步走向完善和成熟。其主要標志是:發表和出版了上萬篇(種)的專業文獻,形成了情報語言學基礎著作和核心文獻;形成了一支優秀的核心研究者隊伍,涌現出了一大批造詣很深的學科開拓者和學術帶頭人;建立了情報語言學學科理論體系和課程教學體系;編制了適應各類文獻機構、各種文獻類型的綜合性或專業性的分類法、主題詞法和分類法主題法一體化詞表;制定和頒發了系列的檢索語言編制標準、標引標準和作為標準的分類法和主題詞表;在引進計算機技術,研究標引和檢索技術等方面取得許多突破性進展,自然語言檢索技術研究展現了良好的發展前景;對面向21世紀的新型情報檢索語言和情報語言學開展了積極研究,取得了一些具有前瞻性的成果。
      2 情報語言學文獻研究
  情報語言學作為一個比較成熟的分支學科,其中一個顯著的標志就是發表和出版了一批數量可觀的研究文獻,其中不乏經典之作,形成了本學科的基礎文獻和核心文獻。
  根據張琪玉編制的《情報語言學文獻庫》(電子版)按年度統計,1949~1999年共計9343篇(種),如果收全1998、1999年文獻,50年中總文獻量可望達到萬篇以上。在50~70年代的30年中,情報語言學文獻數量是很有限的,50年代為164篇(種),60年代為220篇(種),70年代為158篇(種),說明建國后的30年中, 情報檢索語言的研究是僅僅處于一個起步階段,研究的問題面也很窄。特別是在建國之初和文革動亂的一些年度中出現了空白或文獻量極少的情況,說明建國之初百廢待興,10年動亂,學術研究幾乎處于停滯狀態。
  情報語言學作為一個分支學科,其發展和繁榮開始于80年代。80年代前五六年中,文獻數量成百地遞增,至1985年, 年文獻量已達到507篇(種),整個80年代的文獻量達到了4360篇(種)。
  90年代在80年代的基礎上繼續保持高度繁榮,在一個很高的平臺上保持快速發展,在1998、1999年文獻收錄非常不全的統計下,總數也達到了4397篇,可見情報語言學在90年代已走向成熟,而且保持著強勁的發展勢頭。
  僅從文獻數量看,我國情報語言學學科真正的發展歷史不過20年。從80年代開始,情報檢索語言從經驗型和實用性的圈子中走出來,開始其學科理論的構造,搭建其學科框架,使情報語言學作為一個分支學科逐步走向完善和成熟。
  我國情報語言學論文的主要情報源是(括號中數字是發文量):《圖書館學研究》(344)、《中國圖書館學報》(234)、《情報理論與實踐》(230)、《圖書館建設》(219)、《圖書情報工作》(218 )、《科技情報工作》(193)、《現代圖書情報技術》(183)、《圖書情報知識》(181)、《江蘇圖書館學報》(180)、《圖書館雜志》(178)、《大學圖書館學報》(173)、《圖書與情報》(159)、 《四川圖書館學報》(143)、《圖書分類論壇》(137)、《圖書館理論與實踐》(137)、《山東圖書館季刊》(126 )、 《情報資料工作》(122)、《情報科學技術》(118)、《情報學報》(111)、 《云南圖書館》(108)、《情報業務研究》(107)、《圖書館學刊》(103 )、《圖書情報論壇》(102)。以上登載100篇論文以上的23種專業期刊,可以確定為情報語言學的核心期刊。
  孫勇和王秀玲曾對1949~1995年我國情報語言學著作進行了統計分析,共143種,其中編著104種(占72.7%),譯著39種(占27.3%)。1995年以后,也陸續有著作出版,因此至今,著作總數應在150 種以上。
  根據情報語言學著作自身的影響,以及對情報語言學學科建設的影響,以下10部著作可認為是情報語言學的核心著作:《情報語言學基礎》(張琪玉編著)、《現代西方主要圖書分類法評述》(劉國鈞著)、《圖書分類學》(白國應編著)、《圖書分類》(李嚴、史永元、張函、侯漢清、馬張華編著)、《圖書分類學》(周繼良主編,周紹萍、俞君立、張燕飛編著)、《圖書館分類工作手冊》(侯漢清,王榮授主編,陳樹年、戴維民副主編)、《漢語主題詞表標引手冊》(錢起霖主編)、《主題法的理論與標引》(劉湘生編著)、《情報檢索與主題詞表》(丘峰著)、《主題法導論》(侯漢清、馬張華主編)。
  在情報語言學著作中,還出版了一批文集,主要有:《劉國鈞圖書館學論文選集》、《杜定友圖書館出版學論文選集》、《張琪玉情報語言學文集》、《當代分類法主題法索引法研究》(侯漢清)、《情報檢索語言綜論》(戴維民)、《聯機環境中的情報檢索語言》(曾蕾)、《阮岡納贊理論及其研究》(葉千軍)等。綜合性文集主要有:《情報檢索語言論文選》、《圖書分類教學參考資料》、《圖書分類學文集》、《文獻分類學論文薈萃》等。
  國外情報語言學系統著作在我國翻譯的約在40種以上,其中主要的有:《情報檢索理論概述》(〔蘇〕切爾內著)、《情報檢索詞匯控制》(〔美〕蘭開斯特著),《圖書分類理論》(〔英〕布坎南著),《冒號分類法理論與實踐》(〔印〕塞克德瓦著),《冒號分類法解說及類表》、《需要以分面分類作為一切情報檢索方法的基礎》(英國倫敦分類法小組著),《分面分類法——專業分類表的編制和使用指南》(〔英〕維克里著),《主題檢索系統設計選擇》(〔美〕米爾斯蒂著),《國外情報檢索語言研究——分類主題一體化的理論與實踐》(呂其蘇等編譯),《情報組織與利用》(〔美〕索爾格爾著),《文獻標引手冊及實例》、《圖書資料的分類》(〔日〕宮坂逸郎、石山洋等編),《圖書分類法史略》(第2卷)(〔蘇〕沙姆林著)。
      3 情報語言學文獻著者研究
  在50年的發展中,我國情報語言學形成了一支數量龐大、有研究核心的研究者隊伍,這是學科發展和建設的重要因素。
  根據《情報語言學文獻庫》的作者的統計分析,50年來情報語言學的個人作者總數為4516人,其中發文1篇的作者數為3153人,發文2篇以上的1363人,發文10篇以上的98人,發文20篇以上的28人,其中:張琪玉(146)、侯漢清(136)、白國應(88)、戴維民(85)、皮高品(62)、劉國鈞(51)、杜定友(50)、錢亞新(48)、陳光祚(44)、劉湘生(38)、葉千軍(38)、傅蘭生(32)、蔡振華(32)、史永元(32)、丘峰(31)、陳曉華(30)、李嚴(30)、李錫初(28)、劉延章(26)、高崇謙(25)、曹樹金(24)、吳聲亮(24)、俞君立(24)、曾蕾(24)、王永成(24)、賴茂生(23)、陳樹年(20)、黃恩祝(20),這28人可認為是情報語言學的第一核心作者。
  情報語言學的核心作者群是情報語言學學科的主要建設者。其中有些堪稱情報語言學的奠基者和開拓者,是情報語言學學術帶頭人。例如:劉國鈞、杜定友、皮高品、錢亞新和張琪玉等。
      4 分類法理論與實踐研究
  建國之初的《東北法》和《山東法》由于編修及時,從而在我國當代分類法史上占有重要地位。50年代掀起了我國分類法編制的一個高潮,共達30部之多,基本滿足了圖書分類工作的需要,這期間比較有影響的分類法有:《廣東人民圖書館圖書分類法》、《中國人民大學圖書館圖書分類法》、《中小型圖書館圖書分類簡表》、《浙江圖書館圖書分類新表》、《中國科學院圖書館圖書分類法》、《武漢大學圖書分類法》等。此外,還對有些舊分類法進行修訂后繼續使用,如金云銘1928年編制的《中國圖書分類法》于1955年修訂;劉國鈞1929年編制的《中國圖書分類法》由北京圖書館于1957年修訂,并在北京圖書館使用。
  從60年代開始,圖書館界極力尋求解決統一分類法問題,1960年編制《大型圖書館圖書分類法草案》就是一次重要努力,雖然編制工作半途而廢,但為70 年代《中國圖書館圖書分類法》 的編制奠定了基礎。1975年《中圖法》第1版的出版,開始了我國統一分類法的新時代。 80年代以后,我國分類法實際上已基本走向統一,從分類法的編制轉到及時修訂分類法上來。但其間編制的《標準文獻分類法》和《中國檔案分類法》等是針對不同文獻類型的重要分類法。
  50年中,在理論和實踐應用方面具有重要影響的分類法是:《中國人民大學圖書館圖書分類法》、《中小型圖書館圖書分類表草案》、《中國科學院圖書館圖書分類法》、《大型圖書館圖書分類法》、《中國檔案分類法》、《中國圖書館分類法》。
  近現代分類法起源于西方國家,因此引進和借鑒國外的先進理論和技術對我國分類法的理論研究和新型分類法的編制具有直接意義。
  建國之初,我國新型分類法的編制思想主要是借鑒前蘇聯的做法。翻譯了一些蘇聯的分類著作和幾部分類法。安巴祖勉、托羅帕夫斯基、杰斯林科都成為了我國比較熟知的專家學者。《蘇聯圖書十進分類法》(改訂本)、《十進分類法》等被翻譯成中文供參考使用。
  由于編制新型分類法的需要,開展了大量的理論研究,對分類法的編制技術也進行了有益的探討,可以說涉及到分類法理論和技術的各個方面。
  1950年6月2日,文化部副部長鄭振鐸親自主持召開了圖書分類法座談會,討論分類法編制的理論與技術問題,這是我國建國后召開的有關分類法的第1次學術會議。 此后召開的各種學術會議和工作會議比較多,其中有較大影響的是“銅陵會議”和“天津會議”。
  1985年在安徽銅陵召開的“《中國法》(第3 版)修訂研討會議”就《中國法》和《資料法》中如何擴大使用組配方法和是否要為綜合性科學立類問題進行了研究。1991年1月在天津召開的“全國《資料法》分面改造學術研討會主要是為《資料法》分面改造決策提供方案及參考意見。會議對《資料法》分面改造的必要性及重要性、分面改造的路向和原則,以及技術方法等3個方面的問題進行了研討。
  我國分類法理論和編制技術研究的重點主要集中在如下方面:( 1)圖書分類法體系的建立,包括基本部類及其序列的確立,基本大類的劃分,馬克思列寧主義、毛澤東思想的類目的設立,社會科學和自然科學部類的序列,按國家劃分類目,依人列類,區分觀點,傳記類圖書的集中與分散,綜合性科學列類等方面的問題;(2 )體系分類法的研究,包括:“集中與分散”的矛盾以及處理這個矛盾的方法,分面分析理論及體系分類法的分面改造技術,復分表交替類目、注釋、參見等的研究;(3 )關于分類法思想性、實用性、科學性“三性”原則的研究,以及分類法提高情報檢索效率的基本方法研究;(4 )分類標記的研究,包括標記符號、標記制度,以及雙位數法、八分法、借號法、字母標記法等方法技術;(5)分類法標準化問題;(6)圖書分類自動化及機讀分類表問題;(7)關于分類目錄的研究, 包括分類排架和組織分類目錄職能的協調、分類目錄與主題目錄的關系及分類目錄前途問題;(8)關于圖書分類實踐若干問題研究,包括各類、各科文獻的分類, 新學科文獻分類,同類書區分,圖書改編等;(9 )關于基本理論研究,包括分類法的概念邏輯基礎和知識分類基礎,圖書分類歷史,圖書分類學(文獻分類學)等;(10)關于國外圖書分類法及其理論和技術的研究等。
      5 主題法理論與實踐研究
  1964年5月,我國航空部編印《航空科技資料主題表》, 它是我國建國后編制的第1部主題詞表,但屬標題表性質。至1971年12月, 該詞表第2版出版時,才標志著我國敘詞語言有了進一步的發展。
  《漢語主題詞表》的編制出版是我國敘詞語言發展的重要里程碑。“漢表”是作為“七四八”工程,即“漢字信息處理系統”的配套項目編制的,它的編制鍛煉了編表隊伍,為我國敘詞語言的發展作了人才準備。70年代編成的敘詞表還有《電子技術漢語主題表》、《原子能科技資料主題詞典》、《機械工程主題詞表》等約六七部。
  80年代是我國敘詞語言的大發展時期,編制的敘詞表至少在60~70部以上。因此,80年代中期,曾有一場分類目錄與主題目錄之爭,有人認為主題目錄要取代分類目錄。由于敘詞語言的發展,全國漢語敘詞表發展方向研討會于1988年12月在北京召開,以期研討敘詞語言有關技術問題。從80年代后期開始,尋求編表模式和編表技術的突破,其中分類法主題法一體化和運用計算機技術編表是重點,均取得了實用性成果。
  90年代以來,我國敘詞表編制的大發展勢頭不減,編制的敘詞也有幾十部之多,其中最具代表性的有《軍用主題詞表》及其系列專業詞表、《中國檔案主題詞表》等。1996年7月在北京召開第2次全國分類法、敘詞法發展方向研討會,不僅展示了90年代的理論成果,也展示了實踐成果。
  到目前為止,我國已編制的敘詞表在百部以上,幾乎覆蓋了各專業和各種文獻類型,構成了我國敘詞語言體系。其中最具代表性的大型詞表是《漢語主題詞表》和《軍用主題詞表》。
  主題法理論與技術研究主要有如下方面:(1 )敘詞表的基本原理的研究。確立概念組配的基本原理,并且綜合了體系分類法、組配分類法、標題法、單元詞法以及關鍵法等多種檢索語言的原理和方法。 (2)敘詞表的宏觀結構和微觀結構的優化。在宏觀結構上打破了“漢表”所確立的“五表齊全”式的宏觀結構,可根據詞表應用的需要選擇結構,特別是分類法主題法一體化的對照表、分面敘詞表的采用,使漢語敘詞表的結構有了新的突破。《國防科學技術敘詞表》和《軍用主題詞表》的等級關系全顯示的應用,極大地優化了詞表的微觀結構。(3 )計算機輔助技術的應用,提高了編表效率,保證了編表質量,而且使詞表的編、管、用一體化。在90年代編制的詞表都運用了計算機編表技術。(4)詞表編制和使用的標準化。制定了一系列標準, 使詞表納入了規范化的范疇,詞表的標準化也帶來了詞表的兼容化的進展。(5 )敘詞表與自然語言的接口及結合使用,以及運用敘詞表控制手段編制自然語言檢索的后控制詞表。
      6 一體化詞表理論與實踐研究
  分類法主題法一體化是當今情報檢索語言主要發展趨勢之一。從60年代初探索開始,到90年代,我國共發表了100 多篇研究和評論文章,編制了近20部一體化詞表。一體化詞表成為我國情報檢索語言的一個重要組成部分,編制技術和理論也走向成熟。在《主題法導論》和《情報語言學基礎》等教材中,一體化詞表都作為一章寫入教材體系中。
  早在60年代,劉國鈞、杜定友就對分類法和標題法進行了比較,并提出了兩者相結合的思想。
  1976年丘峰發表《主題法與分類法》一文將分類法和主題法各種類型進行了比較。1983年侯漢清發表的《也論分類法和主題法的異同》則注重同時從相同和不同兩個方面對分類法和主題法進行比較。對分類法和主題法更系統、更深化的比較研究是張琪玉發表的一系列論文和著作。在其《情報檢索語言》一書中在論述到每種語言時都設有專節進行比較研究。
  1981年侯漢清在北京大學圖書館學系以題為《論分類法和主題法的一體化》完成了他的碩士論文。此后,作者又先后撰文評介了國外幾部具有代表性的分類主題一體化詞表。
  一體化詞表有多種編制模式,如改造分類表、改造敘詞表、編制對照索引、編制分面敘詞表等。我國一體化詞表編制模式主要是后兩種。
  北京師范大學圖書館學系楊丹于1984年、武漢大學圖書情報學院的鄧順國于1986年進行的研究為編制《中國分類主題詞表》提供了理論和實踐依據。
  1987年由北京圖書館圖書館學研究部和武漢大學圖書情報研究所共同提出編制《中國分類主題詞表》的計劃。經過5年的編制于1993 年完成。
  分類主題一體化最理想的模式是分面敘詞表。1983年太原機械學院熊興成編的《常規武器工業分面敘詞表》,是我國編制分面敘詞表的首次嘗試。
  1986年底在北京召開的全國社會科學情報工作會議決定,由中國社會科學院文獻情報中心負責籌備組織全國力量編制一部社會科學情報檢索語言。1987年3月約請全國部分專家對這一方案進行論證, 傾向于編成分面敘詞表。會后由侯漢清和戴維民編制的《教育分面敘詞表》成為編制分面敘詞表的示范表。雖然《社會科學檢索詞表》歷時10多年才編成出版,但期間對分面敘詞表的編制技術卻進行了深入研究,同時有多部專業性的分面敘詞表編成出版并投入應用。
      7 標準化理論與實踐研究
  1979年全國情報文獻工作標準化技術委員會成立,其中第五分會是主題標引分技術委員會。此后20年來,情報檢索語言標準化及標引標準化取得了一些顯著進展。
  50年代的《人大法》和《科圖法》由于其編制技術的先進,使用的面比較廣泛,影響比較大,但還達不到統一分類法的目標。1975年《中圖法》的問世開創了分類法的新時代,它被各類圖書館廣泛使用,從此不再討論編制新的綜合性分類法問題。1980年《中圖法》第2 版修訂出版以后,全國各級各類圖書館有96%使用它。事實上它已成為一部標準分類法。“漢表”出版以后,其所確立的詞表結構體系和詞匯基礎都得到廣泛的認可,為其他詞表的編制起到了規范作用,具有標準化意義。
  從80年代開始,標準化研究和標準的制定進程加快,提出了系列標準草案和送審稿。根據這一背景,文標會五分會等于1989年10月底在成都召開了全國分類法與主題法標準化研討會。會議的目的是推動我國圖書情報和檔案系統檢索語言體系逐步走向標準化。會議的主要內容是討論有關分類法、主題法的4項國家標準(送審稿), 即《文獻分類顏色標識規則》、《中國法》作為國家標準送審稿、《文獻分類規則》國家標準(送審稿)、《文獻敘詞標引規則》國家標準(修訂送審稿)。
  到目前為止,情報檢索語言及標引方面的標準尚有2 項未批的標準報批稿:《文獻分類標引規則》(報批稿)和《文獻分類顏色標識規則》(報批稿)。已作為國家標準批準頒布的有5項:GB/T13745 《學科分類與代碼》、GB3860 《文獻敘詞標引規則》、GB13190 《漢語敘詞表編制規則》、GB15417 《文獻多語種敘詞表編制規則》、GB15418 《檔案文獻標引規則》。
  90年代始,各行業和軍隊也相應制訂了一些標準,其中最具影響的是關于軍用主題詞表編制規則和軍事文獻標引規則的國家軍用標準,具體包括:GJB1776—93 《軍用主題詞表編制規則》、GJB2418.1 《軍事文獻主題詞標引規則》、GJB2418.2  《軍隊檔案主題詞標引規則》、GJB2418.3 《軍隊情報主題詞標引規則》、GJB2418.4 《軍事圖書主題詞標引規則》、GJB2418.5 《軍隊機關公文主題詞標引規則》。
  在標準化方面,長期研究和呼吁的是關于書次號的標準化,許多學者進行了積極倡導。實現書次號編制標準化最有效的途徑就是編制統一使用的著者號碼表。但我國建國后,人們各自為政,編制了幾十種著者號碼表。其中《通用漢語著者號碼表》是由文標會五分會組織編制的,主要是為了促進我國中文圖書同類書排列書次號的規范化、標準化,是一部編制的非常實用的著者號碼表。但各圖書館在書次號編制上都有自己的習慣做法,因此,《通用漢語著者號碼表》推廣是有一定的難度。
  外文圖書采用的著者號碼表基本趨向統一:英文圖書采用《克特著者號碼表》,俄文圖書采用《俄文圖書著者號碼表》,日文圖書采用《植村著者號碼表》等。
  在我國標準化進程中,也做了大量引進和介紹國際標準和其他國家標準工作,以對我國標準制訂起指導和參考作用。
  UDC作為全世界廣泛使用的分類法, 實際上是一部國際標準分類法。我國GB7713—1987規定,科學技術報告、學位論文、學術論文的封面上應盡可能注明UDC號。ISO規定,凡該組織及其成員國頒布的標準文獻上必須印UDC類號,我國也已執行該決議。 《國際專利分類法》是專利領域的一部最通用的分類法,是實際上的標準分類法。英國標準學會為ISO編制的《基礎敘詞表》,企圖以標準形式確立其標準性質, 我國也翻譯了這部一體化詞表,名稱為《標準文獻主題詞表》,專門用于標準文獻的標引。我國引入的國際標準主要有:ISO2788—1986 文獻工作——單語種敘詞表編制與修訂準則、ISO5693—1985 文獻工作——文獻審讀、主題分析與選定標引詞的方法、ISO5694—1985 文獻工作——多語種敘詞表的編制與修訂準則。
  與標準化同步,我國情報檢索語言兼容化在實踐上也取得了豐碩成果。主要表現在:(1)通過制定標準, 來規范詞表的結構模式和選詞標準,如敘詞表編制的國家標準和國家軍用標準。(2 )《中圖法》和《漢語主題詞表》等綜合性檢索語言由于其權威性和影響力,同專業性的分類表和詞表在實踐上實現兼容。(3 )通過編制對應表式一體化詞表和分面敘詞表式一體化詞表,實現兩種語言的兼容。(4 )在一個系統內,通過有效的組織和提供統一的計算機輔助編表系統,實現系統內部兼容,如《軍用主題詞表》與20部專業詞表實現了有效兼容,《國防科學技術敘詞表》在編制機讀版時,將11部詞表集成起來,實現兼容。
      8 情報檢索語言新技術應用研究
  計算機技術的應用是情報檢索語言及標引與檢索技術取得重大技術進步的基礎。
  我國70年代開始探討敘詞表的計算機編制和管理技術,但直到80年代才有應用成果。中國科學院計算技術研究所從1983年10月開始研制詞表管理系統(TMS系統), 用于編制和管理《計算機科學技術英語詞表》。1987年在南京和上海成功地用計算機軟件在IBM/PC 微機上編制了兩部漢語敘詞表——《教育分面敘詞表》和《教育科學敘詞表》。后來的《教育主題詞表》、《中國分類主題詞表》等都是運用計算機技術編制成功的。有些在編表的同時建立了比較完善的詞表管理系統,其中最具代表性的有《軍用主題詞表》、《農業科學敘詞表》和《國防科學技術敘詞表》管理系統等。
  由文化部立項,山西省圖書館與北京圖書館、中國科學院文獻情報中心、中國人民大學圖書館研制的《計算機文獻標引對照系統》于1997年完成并通過鑒定。它在《中國分類主題詞表》基礎上予以擴展,實現了《中國法》、《科圖法》和《人大法》號碼的自由轉換,以及三法的號碼與《漢語主題詞表》的主題詞相對應,具有聯機標引功能,也可用于檢索選詞選號。
  我國目前開發應用的詞表系統中,《軍用主題詞表》應用管理系統(EMT)、中國農業敘詞庫及其管理系統、 《電子版國防科學技術敘詞表》具有一定的代表性。
  我國早在1963年就開始介紹國外自動標引研究情況,但是直到80年代,漢語自動標引研究才開始起步。1980年11月至1981年4月, 陳培久利用TK—70計算機和T4100 漢字系統建立了“漢語科技文獻自動標引試驗系統”。80~90年代,國內學者提出許多自動標引方案。這些方案從類型上劃分有形式匹配法、切分標記法、統計法、語法語義分析法、神經網絡法等。
  自動分類研究開始于50年代末,現已達到實用化階段。自動分類包括自動聚類、自動歸類和類號的自動轉換3部分。1982 年侯漢清與黃剛發表《電子計算機與文獻分類》探討和介紹了國外自動分類的研究情況。到80年代中期及其以后,我國有不少學者對自動分類進行了試驗和系統開發。如:朱蘭娟在王永成指導下進行的試驗研究,1995年金巍在張琪玉和王永成指導下完成的以腫瘤學專業文獻為例的中文自動分類系統研究,1995年蘇新寧、徐進鴻、史九林合作研究的檔案自動分類方法,1995年葉新明關于基于《中圖法》的中文文獻自動分類研究等。我國研制和試驗的主要自動分類系統有:輔助歸類系統(莫少強,1984)、自動歸類系統(朱蘭娟等,1986)、輔助歸類系統(張炳恒,1989)、自動歸類系統(蘇新寧等,1995)、自動歸類系統(葉新明,1995)、自動歸類系統(吳軍,1995)、自動歸類系統(王永成、張坤,1997)、自動歸類系統(劉開瑛等,1997)。
  全文檢索是自然語言檢索的重要方式。我國全文檢索系統中以北大方正和東方龍馬開發的系統最為出名。世界流行的全文檢索模型有布爾邏輯檢索模式、概率推理模型和空間向量模型。我國的檢索模型單一,主要以布爾邏輯檢索為主;各類截詞檢索是最常見的方式;概率推理方式和空間向量方式,理論研究少,實用的檢索系統更少。
  后控制詞表理論研究日臻成熟,對我國詞表的功能、形成等問題的研究帶來了新的視角。自然語言檢索作為情報檢索的一種方式,離不開情報檢索的基本原理;后控制詞表作為對自然語言的有效控制,為改進聯機網絡內的檢索效果起到了重要作用。專家學者一致認為,后控制詞表是實現受控語言與自然語言結合的有效途徑,并對其控制機理、控制程序、檢索效率和詞表編制方法展開了廣泛討論。
  自然語言接口是敘詞表中自然語言檢索的入口,性能良好的自然語言接口能較好地實現自然語言與受控語言的轉換,提高自然語言與敘詞語言的兼容度,提供多種查檢途徑。1998年通過鑒定的“《軍用主題詞表》應用管理系統”提供的自然語言接口是通過對敘詞詞素的輪排來實現的,并加入了人工智能的原理和方法,在國內處于領先地位。
      9 面向21世紀情報語言學研究
  從80年代后期,尤其是90年代,許多學者對未來情報檢索語言進行了展望和構想。
  曾蕾認為在聯網環境中情報檢索語言有以下發展趨勢:情報檢索語言詞匯的聯機顯示;多數據庫查詢中的詞匯兼容,采用自由詞以提高聯機狀態下的主題途徑查找效率;加強檢索語言及檢索系統的易用性和透明性。
  張琪玉在1997年分別在《圖書館雜志》和《北京大學學報》(信息管理系專刊)上發表文章,披露了他關于未來新型情報檢索語言的設計思想,即學科—事物概念—組配型檢索語言,它是一種集各類情報檢索語言以及自然語言之所長的新型檢索語言模式。
  白國應認為,21世紀中國檢索語言主要有10個發展方向,即多樣化(從單一化走向多樣化)、一體化(分類法主題法一體化)、兼容化、國際化(通用化)、組配化、規范化(標準化)、自動化、自然化(采用自然語言)、專業化和整體化。
  張琪玉在1997年發表的《世紀之交中國情報語言學發展之路》一文中,提出了我國情報語言學面臨的8個方面的研究課題。 次年又在《情報語言學領域亟待研究且潛藏較富的課題》一文中,更加明確地提出了我國情報語言學未來需要研究的5個方面的研究課題:(1)情報檢索語言研究課題,包括體系分類法的改造,敘詞表的分面化改造及與自然語言相結合,自然語言接口及對應轉換詞典;(2 )自然語言檢索研究課題,包括自動抽詞及抽詞詞典,單漢字檢索系統的改進,全文檢索系統的改進,后控制詞表編制的自動化;(3)網上資源檢索研究課題, 包括適用于組織和檢索網上資源的檢索語言的探索,中外主要情報檢索語言之間對應轉換,中外主要自然語言之間的對應轉換;(4 )情報語言學基礎研究課題,包括知識分類的微觀立體網絡化,情報語言學與術語學的結合,未來情報檢索語言的探索,用戶研究;(5 )文獻標引和檢索某些具體問題的研究課題。
  總之我們認為,在21世紀,情報檢索語言仍是發展主流,并將廣泛應用。同時自然語言應用范圍將越來越廣,并在應用中充分吸取情報檢索語言的原理和方法,走相互結合、相互融合的發展之路。在情報檢索實踐中,情報檢索語言將不斷優化、改進、探索出新型的理想的情報檢索語言模式。
  來稿時間:1999—11—01
中國圖書館學報京62~69G9圖書館學、信息科學、資料工作戴維民2000200050年來,我國情報語言學逐步走向完善和成熟:發表和出版了上萬篇(種)專業文獻,形成了一支優秀的核心研究者隊伍,建立了情報語言學學科理論體系和專業課程教學體系。在情報語言學文獻、作者、分類法、主題法、一體化詞表、標準化與兼容化、新技術應用等的實踐與理論研究方面都取得了可喜成績,并在面向21世紀的新型情報檢索語言的研究中取得了前瞻性的成果。情報檢索語言/1949~1999年/研究/綜述  Information retrieval language./1949—99./Studies./Review.In the last fifty years, studies in information retrievallanguages are developing towards perfection and  maturity,which are reflected in the following aspects: about tenthousand titles of research papers/works have been published,a group of researchers has been formed,a theoretical systemand educational curricula have been established. Some goodresults in the research of  new  information  retrievallanguages oriented to the twenty—first century have beenobtained.戴維民,南京政治學院上海分院(原空軍政治學院)信息管理系主任、教授,《文獻工作研究》雜志主編,主要研究情報語言學。通訊地址:上海市江灣五角場。郵編200433。 作者:中國圖書館學報京62~69G9圖書館學、信息科學、資料工作戴維民2000200050年來,我國情報語言學逐步走向完善和成熟:發表和出版了上萬篇(種)專業文獻,形成了一支優秀的核心研究者隊伍,建立了情報語言學學科理論體系和專業課程教學體系。在情報語言學文獻、作者、分類法、主題法、一體化詞表、標準化與兼容化、新技術應用等的實踐與理論研究方面都取得了可喜成績,并在面向21世紀的新型情報檢索語言的研究中取得了前瞻性的成果。情報檢索語言/1949~1999年/研究/綜述  Information retrieval language./1949—99./Studies./Review.

網載 2013-09-10 21:27:16

[新一篇] 中國情報學研究的繼承與發展(1990~2005)

[舊一篇] 中國收入——消費關系的協整分析與模糊分析  (注:本文是北京大學中國經濟研究中心世界銀行1997年客座項目,感謝胡太源博士,易綱教授的指教。)
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表