電子出版物的特征與范圍

>>>  新興科技、社會發展等人文科學探討  >>> 簡體     傳統


  (武漢大學圖書情報學院 陳光祚)
  電子出版物是繼印刷型出版物之后出現的一種新型出版物。它體現了現代信息技術在出版業中的應用。與印刷型出版物比較,它的信息載體不是紙張,而是磁性或光子信息存貯介質;它的信息表達形式不是常規的文字符號,而是計算機可讀形式的數據;它能提供計算機化的情報檢索、文獻中信息量的計量分析和知識項的聚類等功能;它能借助于通訊線路實現高速傳輸和網絡條件下的出版發行。
  電子出版物的出現與發展,是出版業的一次革命。它是信息時代的產物和標志。它不僅為出版業增添了一個新的物理形態的出版物,而且它能縮短出版周期、不受印數的束縛、降低出版成本。電子出版物的出現與發展,是人類走向“無紙信息系統”的重要一步。
  電子出版物對社會將產生深遠影響。它將提高人們讀書治學、獲取有用信息的效率;它能使文獻信息從一出版就置于計算機的控制之下,使出版與信息處理實現了有機結合;它將使圖書館面臨一個新的收藏對象,將改變文獻處理與服務工作的流程。
  我們從1978年開始,就一直從事全文數據庫的電子出版物的制作研究。先后得到了三項國家科研基金的支持:國家教委作為文科博士點基金項目1986年下達了“全文數據庫研究”計劃;中華社會科學科研基金于1991年下達“全文數據庫與電子出版物”項目的任務;國家新聞出版署于1992年作為重點科研項目立項,下達“電子出版物制作技術研究”的項目任務。
  從1987年以來,我們的科研項目取得了一系列成績:1990年10月制作完成《湖北省地方志·大事記》、《中國人民解放軍大事記》(解放戰爭時期)等兩個全文數據庫,并通過了國家教委的鑒定,發表了有關的研制報告和技術報告;1991年7月與武漢大學出版社合作,制作成功《國共兩黨關系通史》(150多萬字)的電子出版物,并向社會公開發行。這是利用出版過程中的中間產品激光照排的電子文本加工而成、并由出版社正式發行的電子圖書。《新聞出版報》及其他中央與地方報紙、中央電視臺及地方電視臺對此作了報導,并稱這是我國第一部電子出版物;經技術上的改進,又制作發行了《中國名勝詩詞大辭典》(1993年)、《市場經濟大辭典》(1994年)等電子出版物。
  制作電子出版物,包括下述技術處理:電子版圖書的總體設計;文本格式化;自動與半自動標引;全文數據庫建庫與檢索軟件的編制;電子出版物評價準則的確定等等的研究。
  我們將研究中的成果在有關刊物中作了發表。例如“論全文檢索系統”(《武漢大學學報》(哲學社會科學版)1989年第6期);“輕印刷的中間產品可以開發成全文數據庫并可作為電子出版物發行”(《武漢大學學報》(哲學社會科學版)1991年第6期);“論我國電子版圖書及其制作技術”(《中國出版》1992年第5,6,7期);“利用全文數據庫技術制作電子出版物”(《情報學報》1993年第1期)等。
    1.電子出版物的基本特征
  所謂電子出版物,是繼印刷型出版物之后出現的一種新的出版物類型。它將著作的文本轉換成計算機可讀形式的信息,記錄在磁性載體(磁盤、磁帶等)或光學載體(CD—ROM光盤)上,并在計算機軟件的支持下,自動形成全文數據庫,并提供從著作中的人名、地名、年代、關鍵詞等各種知識項出發對文本進行單項檢索或多項組配檢索的功能,甚至著作中的任何一個字都可以由計算機檢索出來。所檢索到的文本段落,可根據用戶的要求按句、段、節、章等進行輸出,即在計算機屏幕上加以顯示,或由打印機打印在紙上,或由計算機對其進行“套錄”(downloading),將檢索結果以計算機可讀信息的形式記錄到磁盤或光盤上。電子出版物的內容,除了與印刷版相當的著作文本之外,還包含由計算機自動編成的各種索引,以及計算機情報檢索等軟件。借助于這種索引和檢索等軟件,電子出版物允許按照用戶的要求,對著作中的各個知識項進行抽取、排序、重新組織,因而使原先散見于各個篇章段落中的知識項能夠從邏輯上得到集中,提供從各種角度進行知識項聚類的能力。因此,電子出版物的文本成為置于讀者控制之下的,具有全文檢索功能的“活體”。它遠比印刷版圖書擁有更多的使用價值。
  電子出版物的基本特征是:
  1.1 文獻的文本是以計算機可讀數據的形式加以表示的。這種機讀形式的數據,是計算機可以識別、理解、處理的數據。歸根結底,它們是用二進制碼表示的。在遙遠的古代,人們就發明了文字、符號(包括象形文字和拼音文字),它們可以刻在甲骨、石頭上,書寫在泥版、貝葉上,書寫或印刷在紙張上,這些文字符號是供人們識別和理解的。因此這些文字和符號可以說是“人能夠閱讀的數據”。“白紙上印黑字”,長期以來構成了出版物的基本特征。但是,“人讀數據”的形式并不是唯一的。錄音帶、電影片、錄像帶可以記錄聲頻視頻的模擬信息。在這種情況下,所用的載體不再是紙張,而是膠片和磁帶,以及稱為CD的光盤。對于這種形式的數據,人們不能直接“閱讀”,而必須借助于錄音機、播放機與機具才能使人們看到、聽到并理解這些信息。在計算機信息處理的時代,一般使用二進制數據的表示形式,即“計算機可以閱讀”形式。這種“機讀數據”的出現,是二十世紀科學技術偉大成就之一。這是因為:第一,它的記錄密度高;第二,它可以用計算機進行高速準確的處理;第三,它可以借助數據傳輸網絡進行遠距離的傳輸。所有的電子出版物必須以機讀數據的形式出現。這是它首要的特征。
  1.2 電子出版物的信息載體是磁性或光學信息存貯介質。不同載體的物理存貯信息的密度是不同的。隨著科學技術的進步,載體的信息存貯密度越來越大:
  (附圖z10801.JPG
  有人估計,若按每個字符以10[8]mm[3]的密度來存貯信息,那末全球的全部信息可以存貯在一立方米的體積中,可以通過一條光導纖維用二至三周的時間完成傳輸。
  信息載體的進步,直接促進了出版業的進步。例如在古代,紙張以其質輕價廉,并與印刷術相結合,創造了古代文明,奠定了出版業的基礎。在今天,電子數據處理、光學存貯介質以及通訊系統的應用,使電子出版物得以產生。信息技術不僅改變了信息存貯的載體,而且也直接導致新型出版物的出現。目前,電子出版物以CD—ROM(高密度只讀光盤存貯器)和多媒體光盤為主,同時也以磁盤或磁帶為載體。電子出版物不再需要紙張,從而使文獻的產生、閱讀、傳播進入了“無紙時代”。
  1.3 電子出版物中的信息是有結構的,是經過一定的格式化處理而組成的信息的集合。也就是說,電子出版物必須具備數據庫的結構,否則,零亂的信息無法被計算機程序有效地加以處理。電子出版物的基本單元是記錄。一篇文章、一條詞條、一個自然段、一個內容相對完整的章或節均可作為一個記錄。一部電子出版物就是由許多這樣的記錄組成的。而一條記錄之中,又可進一步區分若干個字段。一個字段中,又可進一步區分若干個子字段或重復字段。這都需要根據文獻文本的本身結構來規定。可以說,電子出版物的主體就是數據庫,特別是全文數據庫。
  1.4 電子出版物應有相應的檢索軟件和其它編輯軟件的存在。計算機軟件是“激活”文獻文本數據的動力。在電子出版物中,無論是隨機檢索,還是文中順序掃描,或者對檢索到的文本進行排序、按一定格式進行顯示、打印或套錄,都絲毫離不開軟件的支持。發果僅僅有機讀數據的存在而無相應的軟件,這些數據就是“死”數據,是不可能實現電子出版物的功能的。電子出版物的軟件(包括實現一定數據庫結構的建庫軟件、提供各種檢索功能的檢索軟件,以及實現檢索結果各種處理的編輯、打印、套錄軟件)往往根據電子出版物的文本結構特點和用戶的需要而定。因此,各種電子出版物的軟件不盡相同,有的甚至相差很大。許多電子出版物都有自己特定的軟件(專用軟件)。電子出版物軟件的標準化和通用性是一個需要解決的問題。
  1.5 電子出版物的使用——即檢索或瀏覽,必須借助于電子計算機進行。這里所說的電子計算機,包括大、中、小型計算機,微型計算機。在微型計算機中,還包括掌上型電腦等。電子出版物之所以離不開計算機,一是因為它的文本是機讀數據,只有計算機才能識別;二是因為瀏覽、檢索過程是必須借助軟件進行的,而軟件的運行是不能離開計算機的。這種情況,正如縮微膠片不能沒有顯微閱讀器、錄像帶不能沒有錄像播放機一樣。電子出版物對于計算機的要求是:一是應有較大的硬盤存貯容量。這是因為電子出版物的文獻,少則數十萬字,多則數百萬乃至數千萬字,加上相應的索引,本身容量較大;同時,檢索軟件本身也有數十K至一、二百K字節之多;再者,在檢索和對檢索結果的處理中還可能產生一些中間工作文件,也需占有一定的磁盤容量。二是要求有較高分辨率的顯示器和打印機。
  1.6 電子出版物必須以出版為目標。所謂“出版”,就是公諸于世,以文獻的形式參與社會的知識交流。電子出版物畢竟是出版物,與印刷型出版物一樣,有自己的著作權。在出版物的內容方面,作者與出版社要承担責任,接受社會的檢驗與評論。那些不是以出版為目標的電子文本,例如許多單位用微機或四通打字機形成的內部使用的電子文書文件,是不屬于電子出版物之列的。即使是配上建庫與檢索軟件,也只能稱為電子文書檔案全文系統。
  1.7 電子出版物的發行方式,既可以是作為封裝型的磁盤或光盤出售給讀者用戶,也可以是作為聯機數據庫的形式,以聯機情報檢索服務的方式,以有償服務為基礎,向公眾提供檢索利用。與印刷型圖書的發行相比較,作為聯機提供的方式是一種新增加的發行方式。聯機發行方式有許多優異之處:首先,是借助于通訊線路,能夠使設有聯機系統終端機地方的讀者及時地利用電子出版物。當新的電子出版物或修改更新后的電子出版物裝載到聯機檢索系統之日,就是各地讀者可以存取之時。這樣,地理上的障礙和發行上的延遲都不再存在。也就是說,讀者可以獲得最新的信息,加速了知識的傳播。第二,由于聯機檢索系統可以同時裝載許多電子出版物,例如美國的DIALOG聯機情報檢索系統裝載有數以百計的電子出版物,從《圣經》到電子版的報紙、手冊、年鑒、百科全書等,這樣讀者在使用電子出版物時有廣泛的選擇余地。第三,通過聯機情報檢索系統檢索利用電子出版物,讀者只為實際的檢索時間與檢索量付費,而不象購買電子出版物那樣為整個電子出版物付費。顯然,這種方式的發行對某些讀者來說是經濟合算的。當然,聯機檢索方式的費用,包含下列幾方面的費用:通訊線路費;作為聯機數據庫的電子出版物利用費;計算機處理的機時費;檢索命中結果的打印費;終端租用費等等。從這個角度來說,費用還相當昂貴。對于讀者頻繁使用電子出版物來說,購買封裝型的電子出版物卻是經濟合算的。但是,電子出版物增加了一種發行方式,對讀者來說,就有更大的靈活性和選擇性。電子出版物開拓了一個新的文獻發行渠道。
    2.電子出版物的范圍與種類
  根據前面所說的電子出版物的基本特征,大致可以確定電子出版物的范圍。即以出版為目標、通過市場供應方式發行的,以磁盤、磁帶、光盤為載體,以機讀數據形式表示的,體現數據庫結構并輔有計算機檢索軟件等信息處理手段的,通過計算機加以利用的出版物。符合這個范圍的就是完全意義上的電子出版物。
  但是也有一些例外:
  2.1 書目數據庫。例如美國《化學文摘》、《科學文摘》等大量的文摘、索引、書目等數據庫,是最早出現的機讀數據的集合。它其中包含了二次文獻的全部信息,即題名、作者姓名、作者單位、發表出處頁數、文種、主題標引詞、分類號、文摘等等項目。每篇文獻的描述信息為一記錄。各記錄按順序號(基本上是文獻加工的時間)排列。這些文獻磁帶從60年代以來,一直在發行,是數據庫工業的主要產品之一。這種書目數據庫只包含數據,而無計算機檢索軟件。圖書情報部門購買或租用了這些文獻書目磁帶之后,需自配建庫與檢索軟件。之所以只發行數據而不帶軟件,是因為:第一,這些文獻磁帶是連續發行的;它與新文獻的發表保持平行發展的關系,不斷報道與揭示全世界有關領域的新文獻的信息。因而這些書目數據的累積量很大,一般都達到了數百萬條記錄;第二,用戶采用的情報存貯與檢索軟件互相不盡相同,也沒有必要統一。同時,書目數據是有長期使用價值的,而軟件是經常更新換代的。這些書目數據庫也應屬于電子出版物。盡管它不帶軟件,但用戶必須有相應軟件存在才能使用。它們只是把數據的發行與軟件的發行分開而已;第三,這些書目文獻磁帶的發行對象是圖書情報部門,而非最終情報用戶。圖書情報部門必須對它們進行加工,即將它們裝入計算機,建立數據庫索引,才能加以利用。正如糧店購買的大米面粉,需經過鍋灶的加工才能食用一樣。
  2.2 軟件出版物。軟件出版物的主體是軟件本身(包括源程序和可執行程序),同時也附有一些說明材料。軟件是計算機指令的集合,本身就應該是機讀形式的。特別是可執行程序,只能以機讀形式存在。但軟件只是一種加工工具,它本身一般不包含加工對象——數據。在這一點上,正好與書目數據庫相反。它們都各取一端。
  盡管書目數據未能完全符合電子出版物的所有特征,但仍然可歸屬電子出版物。因為它符合電子出版物的主要特征。機讀書目數據不直接具有檢索功能,可稱為原型電子出版物。
  2.3 軟件出版是為滿足人們的軟件需要而出版發行的,可列為一種有其自身特色的電子出版物。電子出版物的分類,即可按出版物的類型來劃分,也可按信息服務方式來劃分。現列表如下:
  (附圖z10802.JPG
  所謂封裝型電子出版物,是相對聯機數據庫型電子出版物而言的。它將數據及軟件作為一個出版單位,予以“包裝”而發行到用戶手里,這種出版物大多數是電子圖書,它是相對獨立的整體。數據庫的內容相對穩定。
  聯機數據庫型的電子出版物裝載在聯機情報檢索服務系統中,用戶只能通過聯機檢索方式進行利用。這種電子出版物出現最早的是書目數據庫,例如各種科技文獻的文摘、索引、目錄。其后,一些工具書的機讀版也出現在聯機系統中。例如百科全書、手冊等。聯機全文數據庫出現較晚,七十年代末才暫露頭角,但現在發展很快。以電子報紙為例,美國的全國與地方一級的數十種報紙都作為DIALOG聯機系統的全文數據庫而提供檢索服務。作為聯機數據庫的電子出版物,一般來說屬“開放型”出版物,需要對數據庫的內容經常予以更新,數據庫內容的動態性較強。報刊是連續出版的,必須連續更新其數據庫。手冊、大全之類的工具書,也是連續出新版的。至于象經濟商情方面的聯機數據庫,其更新周期更短,最短的每幾十秒鐘更新一次。聯機數據庫型的電子出版物便于讀者獲得最新的信息資料。
  計算機通訊型電子出版物,是一種在計算機網絡條件下,通過各個終端用戶發送和接受的電子出版物,類似于分布式數據庫。這種出版方式主要有電子郵政、電子會議系統、電子雜志等。這一類電子出版物出版的典型方式是作者在自己的終端上創作、編輯論文,其它讀者通過網絡存取并利用它;讀者可以對某一篇論文發表意見,或者與作者對話。所有這些論文以及有關它的意見、對話均可被網絡中的其它用戶閱讀利用。讀者和作者可以通過網絡實現直接的聯系,每一個終端用戶可以是作者、讀者,也可以是自己作品的出版者。在這樣的出版系統中,一篇論文可以與一系列對該論文的不同讀者所作的評論或綜述聯系起來。這種電子出版系統將從本質上改變信息的創造、交流和獲取方式,賦予出版以新的含義。在一定意義來說,這種出版系統是學術界一定范圍的交流系統。
  (本文為北京大學“海峽兩岸第二次圖書資訊學術研討會”上的發言)
  
  
  
圖書館工作與研究津013-016Z1出版工作、圖書評介陳光祚19951995 作者:圖書館工作與研究津013-016Z1出版工作、圖書評介陳光祚19951995

網載 2013-09-10 21:37:07

[新一篇] 電子出版物的多媒體編輯技術

[舊一篇] 電子出版物的選訂、利用與管理
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表