清華同方光盤股份有限公司TPI協辦
根據中國互聯網絡信息中心(CNNC)數據顯示,截止到2004年6月30日,我國上網用戶總數為8700萬,比去年同期增長27.9%,上網計算機達到3630萬臺。網絡國際出口帶寬增長飛速,總數達到53.9G,比去年同期增長190.3%。CN下注冊的域名數、網站數分別達到38萬和62.7萬。伴隨互聯網信息的爆炸性增長,帶來了信息和數據如何高度利用的問題。如果能夠建立一種有效的資源整合機制,就可以將原本分散、獨立的各類型信息資源通過專門的技術和結構,整合在一起,能夠大大方便目前各類型科研信息的檢索,使得信息更加有效地以結構化的方式組合在一起。在信息資源的整合中,人們興趣集中在如何能夠根據用戶的實際使用需要,自動對不同類型的信息資源進行收集、操作和整合。基于這種思路,目前,國家科技部正在進行網絡信息領域的大范圍資源共享基礎設施的建設,包括“973計劃”在內的一大批國家基礎科研項目和科研環境構成了目前國內科研網絡共享信息資源的基礎。為了提高國內的科研基礎環境,國家級的科研基礎工作平臺的建設正在進行當中,科研網站資源的信息資源整合是其中的一項重要內容。通過資源整合,可以有效改善國內科研網絡環境,提高資源利用率。信息資源的開發利用是國民經濟信息化的核心。任何一個國家的信息基礎設施,目的都是使全社會能夠快速有效地獲取、使用信息資源,利用信息創造財富,實現科技、經濟和知識的創新。
1 電子文獻資源整合的概述
1.1 電子文獻資源
電子文獻資源就是包括所有以電子數據形式,把文字、圖像、聲音、動畫等多種形式的信息存放在光、磁等非印刷介質的載體上,并通過網絡通訊、計算機終端等方式再現出來的信息資源。
電子文獻資源的特點:(1)電子信息資源具通用性、開放性和標準化的數據結構,在信息網絡環境下,可供多個用戶所使用,共享信息資源。(2)電子信息資源具有高度的整合性。不受時間、空間限制,可以實現跨時空、跨地域的傳播。(3)電子信息資源存儲容量巨大,占用空間少;檢索速度快,檢索功能齊全,能提供多種檢索途徑。(4)電子信息資源信息類型多樣,輸出方式靈活,可包含從一次文獻到三次文獻等多種文獻類型,能存儲文本、聲音、圖像等多媒體信息,并具有打印輸出、磁盤輸出等多種輸出方式。
1.2 整合
所謂“整合”就是由兩個或兩個以上的事物、組織、資源、信息、關系、能源等在符合一定條件和要求的前提下融合、聚合或重組成一個較大整體的發展過程及其結果。信息整合即取代功能不相同的信息源,融合到相同的平臺,它具有增加信息可靠性、信息可用性、減少設備成本、降低運行成本、可擴展性的特點。整合能夠更好地提高效率、節省費用,可以更好地滿足用戶的需要。
1.3 電子文獻資源整合
國內學者指出,數字信息資源整合(ResourceIntepate)“是依據一定的需要,對各個相對獨立的數字資源系統中的數據對象、功能結構及其互動關系進行融合、類聚和重組,重新結合為一個新的有機整體,形成一個效能更好、效率更高的新的數字資源體系”。在傳播學領域中,信息整合首先要樹立“以受眾為本”的觀念。同理,電子文獻資源整合應該樹立“以用戶為本”的觀念。所謂電子文獻資源整合,是指依據一定的需要和要求,通過中間技術(指數字資源無縫鏈接整合軟件系統),把不同來源和不同通信協議的信息完全融合,使不同類型、不同格式的電子文獻資源實現無縫鏈接。通過整合的數字資源系統,具有集成檢索功能,是一種新型數字資源體系,最終目的是要構筑一個呈立體網狀分布、具有知識相互關聯、輻射延伸功能,向用戶提供智能化訪問和服務的知識系統。
2 歷史動因——國家、社會、經濟發展的需要
2.1 國家經濟模式轉變的需要
20世紀80年代以來,我國經濟一直保持著高速發展的良好勢頭,GDP的年平均增長率一直保持在9個百分點以上。據統計,2003年,經濟增長的資源消耗總量為50億噸,其中原油2.52億噸占世界的7.4%(進口占34%),原煤15.79億噸占世界的31%,鐵礦石3億噸占世界的30%(進口占50%),鋼材2.71億噸占世界的27%,水泥8.36億噸占世界的40%等等。這種高開采、高消耗、高排放、低利用的“三高一低”的線性、粗放型經濟發展模式,導致許多自然資源短缺與枯竭,產生嚴重的環境污染,造成對經濟社會、人體健康的重大損害,成為影響我國經濟社會可持續發展的沉重包袱。目前,在我國資源供需總量失衡、后備資源儲量的增長速度趕不上消耗速度、對經濟社會發展的支持力度呈下降趨勢的情況下,為了人類社會的可持續發展,人們把目光轉向了第三種資源——信息。可持續發展的希望在于信息資源的充分開發和利用,只有對信息資源充分地開發與利用,才能實現對物質和能量資源的節省和善用。在組織成:“資源——產品——消費——再生資源——再生產”的物質反復循環流動的過程的基礎上,將有價值的信息與知識融合到從資源到再生產的整個過程中,大幅度地減少經濟社會發展的單位物質消耗,使中國經濟增長與資源消耗的關系表現為由a圖改進到b圖。
附圖{L1P109.jpg}
由上圖可看出,信息資源對經濟模式的巨大改善作用。而現今數量龐大、質量參差不齊、交互性能差的信息資源,能否承担得起改變經濟模式的重担呢?答案是否定的。只有加強對信息資源的整合,提高信息資源的質量和共享程度,才能增加信息的價值,使其在經濟流程中真正發揮作用。
2.2 中國信息化建設的要求
黨的十六大報告指出:“信息化是我國加快實現工業化和現代化的必然選擇。堅持以信息化帶動工業化,以工業化促進信息化,走出一條科技含量高、經濟效益好、資源消耗低、環境污染少、人力資源優勢得到充分發揮的新型工業化路子。”2003年12月召開的國家信息化建設領導小組第一次會議明確指出:在目前我國的信息化建設中,信息資源的開發利用水平滯后于信息基礎設施的建設。樹立把提高信息資源的開發利用水平作為信息化項目的核心目標和評價標準的觀念,具有特別重要的現實意義。于是,作為信息資源的一部分,電子文獻資源的開發利用應該引起人們的高度重視,這是中國信息化建設的要求。
2.3 企業發展的需要
從微觀層面上看,信息已經成為企業發展和增強競爭力的重要資源。以信息資源開發與利用為核心的企業信息化建設,已成為企業競爭力的主要組成部分,通過信息流可以幫助企業整合其它要素,優化生產結構和組織流程,從而更加合理和有效地提高企業的生產效率。有關專家指出,在增值競爭的時代,信息流成為企業取勝的第一要素。在這場“更好、更快、更強”的競爭中,企業只有迅速把握信息,按現代管理手段管理物流、資金流、人才、技術、方法等,才有可能全面提高企業資源配置水平,從而提升企業核心競爭力。由于不同時期建立的、采用不同技術標準、不同系統架構的信息應用系統相互間存在信息壁壘,形成了一個個信息孤島,使系統間信息流通不暢,需要經過各種“轉換”環節,嚴重影響信息資源的交換和共享。解決各種問題的最佳選擇,是通過信息資源的整合,來實現更大范圍的信息共享,創造更高水平的資源價值,提供更加優質的信息服務。才能消除因缺乏信息資源管理基礎標準而產生的“信息孤島”,實現應用系統集成,實現信息的最大增值效應。
3 技術動因——信息技術發展的強大支撐
社會的進步與發展,客觀上要求技術的支撐,每一次的技術革命都為國家和經濟的發展奠定了堅實的基礎。在21世紀,以計算機技術和網絡技術為典型代表的信息技術也必將為電子文獻資源的整合工作的發展作出巨大貢獻。
3.1 信息采集技術
2003年初,國家圖書館成立了網絡信息資源整合科研小組,其中針對表層網頁信息開展了“網絡信息資源收集和保存試驗項目WICP”,此項目所涉及到的信息采集技術有借助各種搜索引擎來完成用戶面向主題的檢索要求,通過直接到互聯網上搜索,為用戶在一個領域內查找、積累信息并最終形成知識,將抓取的知識內容全部返回給用戶的網頁采集技術;綜合運用了人工智能、模式識別、神經網絡等領域的各種技術,自動判別網頁內容,通過用戶個性化的信息需求,根據目標特征信息在網絡上或者信息庫中進行有目的的信息搜尋,并在大量訓練樣本的基礎上,得到數據對象間的內在特征,以此為依據進行有目的的信息提取的網絡信息挖掘技術;可以使用自動獲得的領域模型和用戶模型等知識進行信息搜集、索引及過濾等處理,還具有不斷學習、適應信息和用戶興趣動態變化的能力,從而提供個性化的服務的網絡信息過濾技術等。
3.2 信息描述技術
信息描述技術是指為了有效地組織、管理信息資源,使其在網絡環境中能夠被識別和檢索到,而將其內容、特征、性質等表達出來的技術和方法,元數據描述方法是目前最流行、最適用的網絡信息資源描述技術。元數據是描述信息資源或數據等對象的結構化數據,可以用來揭示各類電子文獻的內容及特性,進而達到網絡資源的組織、分類、索引等目的,以方便檢索,是描述網絡信息資源的一種數據格式。它能用來支持電子資源的定位、發現、評估、選擇等。常見的信息描述技術有都柏林核心元數據(DC)、機讀目錄(MARC)、XML等等。
3.3 信息組織技術
隨著計算機技術和網絡技術的發展,信息組織技術已經實現了從傳統線性到超文本的過渡,其中最有代表性的幾種組織方法有信息資源標識由各類組成,以排序的形式將信息資源自動進行信息標識分類的技術;將文本表示為向量,作為向量空間的一個點,然后通過計算向量間的距離或相似度來決定向量類別的歸屬的信息自動標引技術;將信息資源組織成具有層次關系的Web資源,同時收集資源之間的相互關聯關系,可以動態改變和更新的目錄服務(directory services)技術;跨系統跨平臺的智能化機器翻譯系統的語種自動識別系統技術;通過狀態分析、知識分析、狀態和問題匹配、知識傳遞等過程,將用戶的需求發送到引擎的服務器,并在其內部的數據庫中查找相關資料,將檢索結果按一定規則排列組織,最后通過網絡傳遞給用戶的信息智能導航系統技術等等。
3.4 信息檢索技術
信息檢索已經從傳統手工檢索過渡到計算機檢索階段,而計算機檢索也由脫機過渡到聯機檢索和網絡檢索上,其發展主要體現在信息搜索智能化和信息提取自動化兩方面。為了實現信息檢索智能化,人們將人工智能技術引入到信息檢索中來,已經研究出了各種智能信息檢索方法,提出了許多智能型檢索系統模型,主要分為兩大類型:一類是基于機器學習的大范圍信息檢索系統,另一類是智能用戶個性化信息檢索系統。其相關技術主要有:以原始記錄中的檢索詞,字間的特定位置為對象的運算,提供存取全文的文本空間的全文檢索技術;根據媒體和媒體對象的內容語義及上下文聯系進行檢索的技術;具有擬人的結構標準和功能,處理信息的機器人的智能代理技術;采用了一種新的服務模型,在該模型中服務方是主動的,可直接把用戶感興趣的信息推送,而無須用戶自己去取的基于Push技術的信息獲取技術等。
3.5 信息發布技術
信息的產生和發展都需要必要的發布技術傳遞給用戶。目前,常用的信息發布技術有適用于不同的客戶端計算訪問形式的以XML結構化數據表示為核心的信息資源發布技術;采用XML,通過URL來發布接口和應用綁定的軟件體系結構的Web Service的信息發布和訪問接口技術;增進智能主體(agent)對網絡內容的自動理解和互操作,同時還可以實現同一Web內容的對不同顯示設備的個性化定制的Web Ontology技術等。
3.6 信息存儲技術
21世紀,作為信息技術三大支柱技術的數據存儲技術,倍受業界關注。其中海量存儲自動整合技術使同一系統平臺容納多種存儲介質,并可以對他們進行加工、整理、傳遞和共享;DAS技術將存儲設備直接連接在各種服務器或客戶端擴展接口下,完全以服務器為中心,寄生在相應服務器或客戶端上;NAS技術將存儲容量大的設備通過集線器(HUB)或交換機(SWITCH)直接連接在網絡上,形成存儲系統,直接通過網絡存取數據,實現海量數據的網絡共享,NAS可以應用于任何網絡環境;SAN技術通過特定的互連方式連接若干臺存儲服務器組成一個單獨的數據網絡,提供數據存儲服務。正是這些數據存儲技術的產生和發展為信息資源的整合錦上添花。
4 內在動因——信息的客觀發展因素
4.1 信息資源的記錄保存階段
在人類文明史的發展過程中,信息、知識的記錄保存成為信息傳播與管理的首要問題,人口相傳成為了最早的信息記錄保存方式,但其準確性、時效性、可靠性隨著時間的延續而呈遞減趨勢,從而相繼出現了自然載體、人工載體、紙型載體、縮微載體、音像載體、電子載體、網羅載體等多種形式作為記錄信息的載體,載體形式發生不斷的變化,目前伴隨著信息技術、網絡技術的發展及普遍應用,信息存儲的方式也在劇增,電子文獻資源的數量和種類也在不斷地增加。首先介紹電子圖書、電子期刊、電子文檔、各類數據庫、網上出版物、網絡資源等各種電子文獻資源的優缺點,集中突出各類文獻的各自利用標準,難以實現各類電子文獻資源之間的無縫鏈接。
4.2 信息資源的傳播階段
在古代經歷了口頭傳播、印刷品傳播、政府組織主持的郵驛系統,進入19世紀以后,經歷了科學技術的三次革命,使得傳感技術、通信技術、計算機技術結合成為具有信息化、智能化和綜合化的信息網和智能信息系統,為信息的傳播創造了前所未有的條件,使得信息傳播對社會發展的各個領域產生了巨大的影響。尤其二戰以后,各國把發展的重點放在經濟上,重視國家的綜合國力競爭,信息傳播成為經濟發展的先導,經濟發展的橋梁,成為促進經濟增長的重要環節。網絡化實現了信息傳播的全球化,可以任何地方、任何時間提供集圖、文、表、音為一體的超文本信息,集自然、天文、地理、政治等為一體的信息資源內容,變單向傳遞為雙向、多向的信息交流。地球成為名副其實的沒有地理約束和時間束縛的“地球村”。
4.3 信息資源管理階段
信息技術的出現提供便利條件的同時,產生了內容重復、污染資源環境、增加了信息獲取的難度、信息關聯程度低、檢索范圍局限、易導致重要信息漏檢等問題。1997年,國務院信息化領導小組提出的國家信息化框架,其中包括信息資源、信息網絡、信息技術應用,信息技術和產業、信息化人才隊伍、信息化政策法規和標準規范等要點,是對我國信息資源管理階段的指導性方針,信息資源管理階段的任務在于整合,即在兼顧信息資源現有配置和管理狀況的條件下,對分散異構信息資源系統實現無縫整合,并在新的信息交換和共享平臺上開發新應用,實現信息資源的最大增值。電子文獻整合成為大勢所趨和發展方向。
5 社會需求動因——用戶消費的個性需求因素
5.1 個性需求論
馬斯諾的需求層次將人的需求由低到高分為:生理需求、安全需求、情感需求、自尊需求以及自我實現的需求。低層次需求的滿足,必然激發并產生高一層次需求的行為。隨著生理需求和安全需求的不斷滿足,現在人類最重要的需求已上升為社會需求和文化需求。用戶在促進個性形成和發展,培養良好的自我觀念;學習社會技能,培養社會角色的社會需求過程中和人們在消費物品與勞務的過程中,對精神滿足的文化需求過程中,要不斷地發展和完善自己,而掌握信息則是必不可少的資源。每一個社會成員都必須及時地掌握有效信息,跟蹤有用信息的最新動態,隨時分析信息,調整自我,滿足社會需求。而Internet的發展與推廣,使信息泛濫,掌握有效信息和信息的即時跟蹤讓人們花費了越來越多的時間,如果不對信息資源進行整合,浩如煙海的信息將成為不可利用的垃圾,得不到重要信息的人也將陸續被社會所淘汰。如此惡性循環,社會也將停滯不前。
5.2 用戶需要的心理發展
從心理學的角度講,每個人都擁有完整的心理,或者說沒有脫離開個體的所謂人類群體的心理,反過來,人類群體又擁有共同的心理,或者說不存在彼此隔絕的和截然不同的個體心理。人類共同的心理是“心想事成”,倘若總是心想事成,會促進人們積極地去想,去創造,如若心想總是不成,那這種想的欲望將會漸漸淡化,甚至最后消失。知識經濟時代,人們想的總是如何最快速、最及時、最便捷、最準確地獲取知識,來提高自己的知識水平和能力,適應不斷變化和增長的需求。從個性心理上來講,每個人的需求又都是不同的,滿足這種個性需求的基礎是提供個性化服務。社會正是在這種共性和個性的不斷斗爭和發展之中不斷前進著,信息資源整合能夠更好地滿足人類共性與用戶個性心理的需求。
5.3 用戶需求的哲學思考
信息社會迎來了歷史上最快的技術增長。前輩人根本沒有經歷過技術力量的這種加速度的奇跡伴隨著相應的社會變革和倫理責任的現實。全方位滲透、靈活性以及強大的力量已經使信息與通信技術上升到具有時代特征技術的地位,不僅在事實上,而且在修辭上,甚至在意義上均是如此。計算機將其自身呈現為一種在文化上得到定義的技術,并且成為新千年的一種象征,它所扮演的角色的影響遠遠超出中世紀的磨房、17世紀的機械鐘表以及工業革命時期的織布機和蒸氣機。在主導科學和社會生活及其未來的所有因素中,信息與計算科學和信息與通信技術是當下最具戰略意義的因素。毫不夸張地說,最發達的后工業社會是靠信息過活的,而信息與計算科學和信息與通信技術便是使之不斷增氧的機器。哲學觀點認為,信息是一個具有極大影響力的概念,作為一個有待闡釋的術語,它與數個解釋相關聯,這要看理論定向的需求和迫切程度。任何一個概念都具有不斷發展的擴張力,用戶需求也是一樣。在信息極為重要的現代社會,用戶的需求是革命性的、開拓性的、多維全面的和一維深入的,需要對各種思想的精華加以提煉與透視,這為新的信息資源整合帶來了機遇與挑戰。
電子文獻資源整合處于社會大的開放系統之中,在整個社會中發揮著重要的作用,從以上歷史、技術、信息進程、用戶幾個方面的發展動因分析,可以看出電子文獻資源整合對國家、社會、經濟、企業及個人的重要性和積極性,國家和社會的發展都離不開信息資源這一支柱的支撐,尤其21世紀的發展以網絡技術作為典型代表,使得電子文獻資源的有效開發和利用成為信息時代發展的首要問題。我們應該立足自身情況,充分利用信息系統的優勢,結合社會各系統的有力支撐,大力發展電子文獻資源整合系統。
收稿日期:20021世紀經濟報道廣州(86)L1情報資料工作趙海霞/姜雷20052005文章首先對電子文獻資源整合的基本理論進行介紹,然后從歷史動因——國家、社會、經濟發展的需要;技術動因——信息技術發展的強大支撐;內在動因——信息的客觀發展因素;社會需求動因——用戶消費的個性需求因素等幾個方面詳細分析了電子文獻資源整合背后的社會動因,為電子文獻資源整合提供了理論支撐。電子文獻資源/整合/電子文獻資源整合/社會動因東北師范大學2004年度校內青年基金項目“基于TRS的電子文獻資源整合研究”資助文章,批準號04QN005。張東生/何華峰劉敏A Probe into the Cause of 2003-2004 China Economy Maintenance Imbalance
SONG Jian-jun[1],WU Da-xiong[2]
(1.Guangdong University of Business Studies,School of Finance,Guangzhou 510320;
2.China Everbright Bank,Guangzhou 510000,China)趙海霞,女,1976年生,碩士研究生,東北師范大學傳媒科學學院講師。東北師范大學傳媒科學學院 長春 130117
姜雷,男,1978年生,東北師范大學圖書館助理館員。東北師范大學圖書館 長春 130117 作者:21世紀經濟報道廣州(86)L1情報資料工作趙海霞/姜雷20052005文章首先對電子文獻資源整合的基本理論進行介紹,然后從歷史動因——國家、社會、經濟發展的需要;技術動因——信息技術發展的強大支撐;內在動因——信息的客觀發展因素;社會需求動因——用戶消費的個性需求因素等幾個方面詳細分析了電子文獻資源整合背后的社會動因,為電子文獻資源整合提供了理論支撐。電子文獻資源/整合/電子文獻資源整合/社會動因東北師范大學2004年度校內青年基金項目“基于TRS的電子文獻資源整合研究”資助文章,批準號04QN005。張東生/何華峰
網載 2013-09-10 21:37:08