復雜網絡理論的情報學應用研究

>>>  技術話題—商業文明的嶄新時代  >>> 簡體     傳統


  1 復雜網絡的概念
  2000年,當代最富有影響的思想家之一——史蒂芬·霍金(Stephen Hawking)指出:“我相信,下一個世紀將是復雜性科學的世紀。(I think the next century will be the century of complexity)”[1]。復雜性科學及其復雜性研究,在世紀之交引起了國內外的普遍關注。復雜網絡研究是復雜性科學研究的一個重要部分。研究表明,從生物體中的大腦結構到各種新陳代謝網絡,從 Internet到WWW,從大型電力網絡到全球交通網絡、從科研合作網絡到各種政治、經濟、社會關系網絡,現實世界中許許多多的網絡都是具有小世界現象或無尺度等特征的復雜網絡[2]。復雜網絡的研究引起了不同學科的廣泛重視,成為當前富有挑戰性的重要前沿課題。
  從統計物理學的角度來看,網絡是一個包含了大量個體以及個體之間相互作用的系統,是把某種現象或某類關系抽象為個體(頂點)以及個體之間相互作用(邊)而形成的用來描述這一現象或關系的圖。人們很早就思考過網絡結構的問題,但受到當時的科學發展和技術的影響,一直以為網絡的結構是規則的或隨機的,直到1998年和1999年小世界網絡模型和無尺度網絡的提出[3][4],人們才又重新思考網絡結構問題,而人類計算能力的提高、科技的發展也為人們研究這一問題提供了有力的支持。
  錢學森給出了復雜網絡的一個較嚴格的定義:具有自組織、自相似、吸引子、小世界、無標度(無尺度)中部分或全部性質的網絡稱為復雜網絡[5]。周濤認為復雜網絡大致包含以下幾層含義:首先,它是大量真實復雜系統的拓撲抽象;其次,它至少在感覺上比規則網絡和隨機網絡復雜,因為我們可以很容易地生成規則網絡;但就目前而言,還沒有一種能夠生成完全符合真實網絡統計特征的簡單方法;最后,由于復雜網絡是大量復雜系統得以存在的拓撲基礎,因此對它的研究被認為有助于理解“復雜系統之所以復雜”這一至關重要的問題[6]。
  復雜網絡最重要的是小世界效應(small-world effect)和無尺度特性(scale-free property)。小世界特征說明了規模很大的網絡的任意兩個節點之間存在最短路徑;無尺度特征揭示了真實網絡的結構符合冪律分布的事實。復雜網絡因此有別與人們已經熟悉的規則網絡和隨機網絡。
  從1998年開始,復雜網絡理論受到西方發達國家的廣泛關注;國內則晚一些,基本上是從2002年以后才有這方面的研究論文出現。現在關于復雜網絡的理論研究主要由一些數學家和物理學家在進行,他們主要考慮建模問題、網絡性質、如何提出合適的說明網絡性質的概念、如何進行推理論證等。而應用方面的研究就廣泛得多了,就連語言學、足球、恐怖組織研究都與復雜網絡產生了聯系。因為,復雜網絡的研究,除了本身的理論拓展外,也為其他學科提供了一種進行科學研究的新視角、新方法。它的應用研究已經在其他許多學科中得到了積極的應用。
  2 復雜網絡應用于情報學研究的基礎
  把復雜網絡的理論和方法引入情報學研究,主要是基于以下兩方面的考慮:一是情報學具有多學科交叉融合的學科屬性;二是復雜網絡理論的研究方法和概念及模型越來越多地被應用于其他學科的研究之中。
  2.1 情報學的學科特點
  情報學是一門邊緣性、交叉性、綜合性較強的學科,在它成長壯大的過程中,不斷吸收其它學科的理論和方法,拓展豐富自己的研究領域和內容,與其他學科的不斷交叉融合使情報學呈現出多學科化特征、多方位的發展趨勢。情報學自形成以來,多學科的方法和技術已經成為情報學研究的重要來源,引入的理論方法有:老三論(信息論、控制論、系統論)、新三論(耗散結構理論、協同論、突變論)、管理科學、行為科學、領導科學、圖書館學、運籌學、數學、統計學、電子技術、計算機技術、縮微技術、網絡技術、聲像技術。這些理論、方法、技術有些已與情報學相互滲透,結合成為有機整體;有的還正在消化、吸收,處于不斷完善之中,使情報學的研究欣欣向榮并形成了較為完整的學科群。
  2.2 復雜網絡理論的特點
  復雜網絡理論本身的研究已成為統計物理學中的熱點,而它的應用研究更是在許多學科中正在進行著,并取得了不同的成果。這說明復雜網絡的研究方法和成果可以有更廣闊的應用空間。在已經進行的研究中,有些研究課題與情報學相關,如科研合作網研究、論文被引用研究。只是這些研究都是從物理學角度進行的,而這些研究內容也屬于情報學領域的內容,目前還沒有情報學家從情報學的角度來進行研究,對它的情報學意義進行解釋。情報學本身的學科特點,加上復雜網絡的廣泛應用及其在情報學領域的初步嘗試,這些因素共同作用,決定了復雜網絡理論將在情報學的發展中繼續發揮作用。
  3 復雜網絡理論在情報學中的應用
  雖然復雜網絡的研究時間很短,但縱觀情報學的研究內容,已經有些研究涉及到這方面的內容。最早的應用是在競爭情報領域中關于人際網絡的研究,隨后更多的研究則集中于Internet、www和科研合作網絡的研究。
  3.1 科研合作方面
  為了研究某一學術領域的發展變化,某一個新的思想在此領域內的產生、傳播,研究人員構造了一個科學家之間通過文獻相互聯系影響的網絡。以科學家為節點、兩個科學家共同完成一篇論文為一條邊,或以論著為節點、一次引用為一條邊。研究發現,它們具有高聚集性和冪律分布的重要特征。
  2001年美國Santa Fe研究院的Newman發表了他對美國一些常用數據庫的統計結果。他選取了如下這些數據庫:Los Alamos電子出版論文-預印本、Medline生物醫學研究論文、斯坦福公共信息檢索系統 (SPIRES)、高能物理論文、網絡計算機科學技術參考庫(NCSTRL)等。他計算了從10,000-2,000,000的結點(論文),結果發現它們符合小世界現象和無尺度特征[7][8]。
  武漢大學數字與統計學院的劉杰、陸君安在他們的論文《一個小型科研合作復雜網絡及其分析》中,對 1998年1月至2004年6月間發表于《物理學報》和《Chinese Physics》上混沌科學方面的科學研究論文作者合作研究所形成的小型網絡進行了初步研究[9],在大的連通組群內顯示出小世界性和冪律。
  3.2 Internet方面
  Internet在域級和路由器級可得到兩個不同的拓撲,經驗結果顯示無論哪一種拓撲度分布都服從冪律。如果把WWW的網頁作為節點,把html網頁之間通過URL的超鏈接當作鏈路,可以得到一個WWW的信息網絡,廣泛研究WWW的結果顯示度分布遵從冪律。
  梁戰平指出,小世界現象是情報學的8個前沿領域之一。他敘述了小世界現象的由來并給予評論說:“‘小世界現象’對于情報工作者如何快捷、準確獲取網上信息提供新思路[10]”。目前急需深入研究小世界現象究竟會對情報學會產生哪些影響。
  我國學者的研究涉及利用Internet的復雜網絡特征——小世界性來改善網絡信息傳播和網絡安全管理。司徒俊峰根據W-S的小世界網絡模型,認為 Internet是一個小世界網絡,具有集團化、聚類的特征,作者在分析Internet網絡特征后,提出了如何運用小世界原理來改善Internet的信息交流過程及網絡關鍵結點的建設和保護等[11]。
  3.3 信息檢索方面
  文獻12是國家自然科學基金資助項目成果。該論文在萬方數據生物醫學期刊(1062種,150萬篇)作者在合作研究中形成的復雜網絡的基礎上,將檢索結果可視化,應用在文獻檢索的結果展示上,為用戶呈現合作網絡的結構,將數據庫中大量隱藏的合作關系展示給用戶,同時還可以對圖中任意節點進行交互式訪問,為復雜網絡及可視化在文獻檢索的增值服務做出了有意義的探索[12]。
  3.4 競爭情報中的人際網絡方面
  在競爭情報研究中,人際網絡對競爭情報的獲取極其重要。已有多位學者提出了情報活動中的人際關系網絡問題。文獻13指出:在實際工作中,人們獲取情報時,注意力大多集中在情報的物理載體上,而甚少關注情報的活的載體——人腦。但是,一些新的科學假設、技術發明的原始沖動、經驗、訣竅和方法,往往又是存儲在人腦這個活的載體中。某一重要數據和最新情況,倘若你不掌握,你的朋友或者朋友的朋友或許知道。這就是人際網絡問題。普賴斯科特在給中國的《競爭情報叢書》所寫的序言中,更是將人際網絡及其運行機制,作為提升西方競爭情報實踐的四項經驗之一。人際網絡是一種非常抽象、非常模糊的社會現象,始終處于變化、發展之中。如何將其以直觀的形式(如網絡模糊圖、鄰接矩陣等)表現出來,如何借鑒其他學科領域的成功經驗,對競爭情報活動中的人際網絡進行優化管理,是當前情報工作的當務之急。國家社科基金項目2005年度課題就有競爭情報活動中人際網絡問題研究,探討在社會運轉和經濟活動中,如何利用口耳相傳的零次情報,構建和利用人際網絡來提升企業競爭能力。對相關問題的研究會成為今后若干年內情報學研究的一個熱點。
  3.5 知識擴散方面
  文獻14運用小世界網絡模型模擬了知識在社會網絡中擴散的過程,研究發現知識擴散中存在“小世界”現象,即知識在小世界網絡中擴散后的平均知識水平最高,且知識差異最低。
  關于國內外在復雜網絡領域做出的重要成果很多,需要情報學專業研究者加以全面深入的研究和借鑒,有大量的工作需要完成。
  4 復雜網絡的研究方法在情報學研究中的應用
  復雜網絡的研究,為我們提供了一種研究問題的新視角、新方法、新工具。首先,在研究方法上,創造了一系列更好地理解拓撲結構與功能關系的分析方法;其次,它提出了一系列指導復雜網絡研究的概念、命題、基本原理及其相關的理論,使對于復雜網絡的研究面目一新,并把這些理論、概念應用于其他領域的研究,使我們認識到網絡不僅是一種客觀存在,也是一種觀察事物、分析事物的方法。復雜網絡獨特的研究視角是從整體角度來關注網絡結構對其功能的影響。
  從情報學研究歷史來看,情報學的研究方法有許多都是從其他自然科學和社會科學中移植過來的。情報學特有的文獻計量方法,也是借用、移植數學和統計學方法的基礎上加以創新、完善而形成的一種新型的研究方法,創新主要體現在布拉德福確立的特殊的統計方法——等級分布法。
  網絡分析的方法已經應用于競爭情報的人際網絡研究。除此之外,還可以運用于情報學其他領域,因為在情報學領域存在著這樣一些網絡:詞與詞之間的語義聯系,計算機之間的網絡聯接,網頁之間的超鏈接,科研文章之間的引用關系以及科學家之間的合作關系,計算機病毒在Internet網絡或郵件網絡上的傳播等等。雖然每一個網絡都有其自身的特殊性質,有其緊密聯系在一起的獨特現象,有其自身的演化機制,但是都可以使用網絡分析的方法,例如關于頂點度值、介數的分析方法以及大量不同網絡中存在的相同的統計特征。把網絡分析的方法移植到情報學當中來,它既可以作為單一的研究方法存在,也可以和其他情報學方法結合。
  復雜網絡的研究方法被用來解釋復雜系統之所以復雜,實質上它是一種系統的方法。它也符合系統科學方法的三個明顯的特點:整體性、綜合性和最優化。有學者認為[15]:未來情報學研究中,系統科學方法會成為帶頭方法。從這一點來說,網絡分析的方法是情報學研究新的生長點。
  基于以上分析,筆者提出把網絡分析方法應用于情報學研究,這與其研究內容和發展趨勢都是相符的。
  5 復雜網絡的研究成果在情報學研究中的應用
  在情報學領域存在許多網絡,它們都構成某種復雜網絡,可以利用復雜網絡的共同特性——小世界、無尺度性和高集團度等性質,在復雜網絡研究的旗幟下進行研究。除前面介紹的應用領域,筆者認為如下幾個情報學領域的一些問題可以應用復雜網絡的方法和理論進行進一步研究。
  5.1 科研合作網絡研究的情報學意義
  在已經進行的復雜網絡的研究中,科學家之間的合作研究是和情報學關系最密切的內容之一。科學家已經得出結論,科研合作網絡具有小世界性和無尺度的特性,但還沒有說明這些復雜網絡的概念有何情報學意義。在科研合作網中,如何利用復雜網絡的相關原理判斷學者的影響力?其他一些性能指標有何情報學意義?需要定義哪些新的性能指標?這些都有待于深入的研究。
  5.2 復雜網絡與信息傳播
  復雜網絡具有小世界現象和無尺度兩個明顯的特征,我們可以運用這兩個工具來研究這樣的網絡結構對信息傳播有哪些影響。
  信息傳播會形成一個復雜網絡。從復雜網絡的角度來研究如何構建最優的信息傳播網絡,保持網絡的穩定性,促進信息傳播和轉化;是否可以利用小世界.特性來加速信息交流等等。研究在小世界網絡中的信息交流有何特點,如何加速或減緩交流等。
  網絡上的信息傳播也同樣適用。對于網絡上信息的交流、我們更關注如何提高網絡效率,提高信息流的速度,信息如何能夠更快、更準確的傳播。從Internet的物理結構也就是基礎設施來看,因為信息在網絡的傳播依賴于網絡的路徑,Internet的路徑的大小影響著信息在互聯網上的傳播。改變它的拓撲結構也就是使平均路徑變短,這樣可以加快信息傳播,減少傳播過程中信息的損耗與失真。
  研究表明:在賽博空間的信息傳播,也就是網絡用戶之間的相互訪問基本上也呈現出復雜網絡的統計特點。信息能夠在此類復雜網絡中得到迅速傳播,這一點與疾病、笑話、時尚等具有類似特征的元素流行有共同之處。在傳播的過程中,活躍個體造成的“長程連接”是信息迅速傳播的關鍵所在。可以考慮從物理和虛擬空間來改善信息的傳播,根據人們的需要加速或抑制其傳播。
  5.3 復雜網絡與信息資源配置
  社會中的各種信息機構也構成一個復雜網絡,信息機構間地理關系和位置聯系又是怎樣影響信息配置的?怎樣構建適合的網絡更有利于信息共享?這些問題都與復雜網絡研究有聯系。
  信息資源共享一直是圖書情報界和信息管理界關注的重大課題。傳統的研究主要從兩個方面著手解決這一問題:一是考慮信息資源在地理區域上的合理布局和配置來實現最大限度的共享;一是通過信息提供者之間的合作來實現信息資源共享。就信息資源配置的結果來說,滿足社會信息需求的程度越高,信息資源優化配置的程度就越高。而這兩方面又都形成一個以信息機構為節點的網絡,所以用網絡分析的方法研究信息資源配置問題或許會有新的發現。
  共享必須合作,合作就要形成網絡,運用復雜網絡的特征來分析現在的信息共享網絡是否是最優化并在現有基礎上構建更大范圍的合作網絡。根據無尺度網絡理論,讓所有人共享所有信息既不經濟也不可能,再大的努力也只能讓大多數人得到大多數的信息,所以重點工作是確定網絡度值大的節點,找出關鍵點,這些點可能就是區域中心圖書館或信息中心,計算網絡中關鍵點的數量,對他們進行重點建設和保護。
  5.4 復雜網絡與信息檢索
  研究復雜網絡的拓撲結構的目的在于認識網絡上的重要過程。例如,我們希望理解www的拓撲結構是怎樣影響Web沖浪和Internet中的網絡搜索和網絡導航。從網絡的結構來關注信息檢索,核心的問題是如何研究各種網絡的拓撲結構、揭示網絡結構與功能之間的關系、發現它們的規律、探索最佳網絡設計及其應用。
  網絡信息資源檢索質量問題一直困擾著我們,進一步說就是搜索引擎的搜索結果的查準率問題,能否利用復雜網絡的理論和性能指標設計搜索引擎的算法,提高查準率。這也是情報學應用研究的范疇。
  5.5 復雜網絡與知識地圖
  自從英國學者布魯克斯提出“知識地圖”的概念后,構建人類知識地圖的夢想首先在企業的知識管理中實現了。但這與我們設想中的藍圖還有差距。現在企業中應用知識地圖的作用就是指引人們尋找所需要的知識,是知識的指引而不是知識的集合。布氏提出的“知識地圖”,是以知識網絡的形式來說明知識單元的發展與變化,從而明確學科知識的發展與變化。 1981年印度的斯·科·森提出“情報基因”理論,他建議從基本概念開始,按照思想基因進化圖譜重建文獻分類體系。在情報檢索領域中亦應從文獻中找出思想基因,按自然進化方式聚類,形成思想基因串,然后再編制成為新型的概念索引,供人們利用。我國學者劉植惠在1996年連續發表論文,提出“知識基因”這一術語,還創立了基于知識基因的分類法。
  以上研究涵蓋了人類幾千年知識的形成、演化、交叉、融合等過程,是一項龐大的工程,在這個過程中,無論哪一種學說,都是以知識為研究對象。知識是有繼承性的,如果能夠確定知識基因及他們之間的聯系,這樣構成一個復雜網絡,我們可以用復雜網絡的方法和理論對其進行研究。在知識地圖的研究中運用網絡分析的方法,確定網絡關鍵節點,可以找出核心位置的概念,在知識進化中起關鍵作用的知識,這些知識是進化的基礎,或者說是核心知識,利用復雜網絡的情報學應用研究,是否可以使知識地圖的研究更進一步?
  5.6 其他應用
  歐美國家的企業高層管理者已經在用網絡分析技術分析企業和組織內部的組織結構,用統計學方法找到信息流的結構特征,以提高組織效率;哈佛商學院的教授[16]Alvin Roth使用網絡分析的匹配 (Matching)技術,為全美國的醫學生就業市場設計擇業程序,解決了幾十年來醫學生就業市場的積弊。
  運用小世界網絡分析知識管理中的知識交流。小世界現象及其相關理論為學術界研究社會網絡開辟了一條嶄新的思路。企業內部員工的知識管理本質上是一個由組織中各職能部門的代表組成的人際網絡。提高知識交流和共享可以有效提高創新的效率,團隊成員中也存在著非正式組織等等。如果用SWN來描述員工團隊的交流網絡,那么“節點”是企業團隊成員,“連接”是他們之間的交流。這樣,就可以用“小世界”的特征路徑長度、集團化系數、斷鍵重聯概率等數量特征來描述和分析員工的交流網絡。每個員工在網絡中的作用是不一樣的,找出關鍵節點,減小網絡的路徑,促進知識共享。
  6 結束語
  目前情報學領域還沒有非常明確地提出復雜網絡的應用研究問題,只是在個別學者研究中有某一方面的涉及。復雜網絡在情報學領域的應用首先是其研究方法——運用計算機進行大規模網絡分析的方法,這為我們提供了一種研究問題的新視角,使我們認識到網絡不僅是一種客觀存在,也是一種觀察事物、分析事物的方法。其次是在具體層面的應用,復雜網絡的兩個最基本的特征是小世界性和無尺度性,這些特性可以在情報學的某些領域應用,如:信息傳播領域、信息資源配置領域、信息檢索、知識地圖、知識交流等,在第二章對上述問題做了全面的論述。
  科研合作網絡和引文網絡是物理學家從復雜網絡的角度進行研究的和情報學關系非常密切的網絡。在對物理學家從統計物理學角度進行的研究加以介紹后,筆者從情報學的視角分析了復雜網絡的性能指標,包括最短路徑、長程連接、連通集團、介數有哪些情報學意義,使科研合作網絡和引文網絡的復雜網絡研究和情報學聯系起來。
  情報學還有一個重要的陣地——網絡信息資源的組織與服務,這也是復雜網絡研究的重要內容。本研究從復雜網絡的理論出發,在了解Internet和www的網絡拓撲結構的基礎上,對網絡信息資源的傳播、檢索、共享進行初步的嘗試性的探索。其中對網絡的無尺度特征在網絡信息資源利用方面的作用進行了總結,同時也對一些指標在信息檢索方面的應用做可能的說明。
  復雜網絡的情報學應用研究的內容不止如上所列,還剛剛開始。隨著關注學者的增多,研究將不斷向縱深發展。開辟復雜網絡在情報學應用的美好未來,是我們這個時代的偉大任務。
  收稿日期:2006-11-16
L1情報資料工作李曉輝/徐躍權20072007
復雜網絡/情報學/小世界效應
文章把復雜網絡的研究方法和研究成果引入到情報學的研究領域。首先從情報學的發展歷史分析了情報學的多學科交叉融合屬性,使它可以接受來自其他學科的理論和方法;系統地梳理了在目前的情報學研究中,有哪些內容涉及到了復雜網絡的問題;最后提出了復雜網絡的研究方法和研究成果都可以在情報學的研究中被應用,并指出了具體的應用領域:科研合作網絡、信息傳播、信息檢索、信息資源配置、知識地圖構建、知識管理等。
作者:L1情報資料工作李曉輝/徐躍權20072007
復雜網絡/情報學/小世界效應

網載 2013-09-10 21:18:03

[新一篇] 關于網絡經濟幾個問題的辨析

[舊一篇] 復雜網絡理論的情報學意義探討  ——以科研合作網絡和引文網絡為例
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表