試論古籍版本數(shù)據(jù)庫的建設(shè)
【摘 要】 隨著古籍?dāng)?shù)字化資源的建設(shè),開發(fā)古籍版本數(shù)據(jù)庫成為重要選題之一。文章以全國古籍普查工作的開展為契機,分析了當(dāng)前建設(shè)古籍版本數(shù)據(jù)庫的重要意義, 提出了古籍版本數(shù)據(jù)庫建設(shè)的內(nèi)容及建設(shè)原則,并列舉了相關(guān)古籍版本數(shù)據(jù)庫建設(shè)的階段成果。
【關(guān)鍵詞】古籍?dāng)?shù)字化;古籍版本;數(shù)據(jù)庫開發(fā)
發(fā)端于上世紀80年代的古籍?dāng)?shù)字化建設(shè),經(jīng)歷了近30年的不斷發(fā)展,如今已經(jīng)取得了豐碩的成果,一些大規(guī)模、具有代表性的古籍?dāng)?shù)據(jù)庫陸續(xù)投入使用。2007年國務(wù)院辦公廳發(fā)布《關(guān)于進一步加強古籍保護工作的意見》(國辦發(fā)[2007]6號),也對古籍?dāng)?shù)字化提出了具體要求,這勢必會將古籍?dāng)?shù)字化建設(shè)推向高潮。
隨著數(shù)字技術(shù)的不斷發(fā)展,開發(fā)滿足有關(guān)古籍版本需求、功能完備的古籍版本數(shù)據(jù)庫成為今后古籍?dāng)?shù)字化的選題之一。本文希望在當(dāng)前古籍?dāng)?shù)字資源庫現(xiàn)狀研究的基礎(chǔ)上,對今后古籍版本數(shù)據(jù)庫的建設(shè)與發(fā)展進行探討。
1.開發(fā)古籍版本數(shù)據(jù)庫的意義
卷帙浩繁的古代文獻是我們祖先留下來的寶貴財產(chǎn),也是傳承我國五千年文明史的重要載體和不可再生的文化資源。正是由于其稀缺性及不可再生性,使得古籍具備文獻價值的同時往往也具備文物價值和藝術(shù)價值。古籍?dāng)?shù)字化及相關(guān)古籍?dāng)?shù)據(jù)庫的建設(shè),為拓展古籍的利用提供了條件與便利。
當(dāng)前的古籍?dāng)?shù)字化項目多以古文獻的內(nèi)容作為切入點。雖說有的古籍書目或全文數(shù)據(jù)庫有部分版本信息,但專門從版本視角開發(fā)的古籍?dāng)?shù)據(jù)庫絕無僅有。而開發(fā)古籍版本數(shù)據(jù)庫,利用現(xiàn)代化技術(shù)發(fā)掘蘊藏的古籍版本信息及其文物價值,對提升古籍全文數(shù)據(jù)庫及其它數(shù)字化項目的建設(shè)質(zhì)量,實現(xiàn)古籍信息的增值性開發(fā),都有著十分重要的意義。
1.1 古籍全文數(shù)據(jù)庫的建設(shè)需要古籍版本數(shù)據(jù)庫的支持
古籍版本對于古籍全文數(shù)據(jù)庫的建設(shè)十分重要,它將直接影響到數(shù)字化產(chǎn)品的質(zhì)量。眾所周知,在長期流傳過程中古籍有著諸多版本,而不同的版本又存在優(yōu)劣和互補。在進行古籍?dāng)?shù)字化時,應(yīng)盡量選擇精良的版本作底本,同時也要與其他的一些版本進行校對,拾遺補闕,這樣才有可能制作出高質(zhì)量的古籍?dāng)?shù)字化產(chǎn)品。
古籍版本數(shù)據(jù)庫匯集的是古代書籍版本的數(shù)據(jù)形態(tài),可以揭示其表征、行款、字體、墨色、裝幀等信息,這就為古籍全文數(shù)據(jù)庫在版本選擇及比較方面提供依據(jù),盡可能地將最好的底本收入數(shù)據(jù)庫,方便讀者研究使用,從而提高古籍全文數(shù)據(jù)庫的建設(shè)水準。
1.2 古籍版本數(shù)據(jù)庫是古籍增值性開發(fā)的直觀表現(xiàn)
古籍不僅僅具有文獻價值,同時也是古代文化藝術(shù)(書法、雕刻、裝幀等)和科學(xué)技術(shù)(印刷、造紙等)的重要實證,而這種實證就是通過不同形式、種類的版本來體現(xiàn)其差別的。
古籍版本的形態(tài),包括版刻工藝、裝幀、用紙、行款、字體、邊欄、墨色以及藏印、題跋等,如用文字描述,說得再詳細也是紙上談兵。而開發(fā)古籍版本數(shù)據(jù)庫,使其具有重現(xiàn)作為歷史文物古籍原貌的功能,并能滿足版本研究、文物鑒賞及原件對照等特殊需要。
同時,開發(fā)古籍版本數(shù)據(jù)庫,可以拓寬古籍利用的渠道。通過對古籍版本中蘊含的數(shù)字素材進行萃取、加工、整合,發(fā)掘其間特有的中國文化元素,形成具有市場價值的文化產(chǎn)品,可供文化產(chǎn)業(yè)采用,實現(xiàn)古籍的增值服務(wù)。
1.3 古籍交換價值的實現(xiàn),急需古籍版本數(shù)據(jù)庫的支持
隨著市場經(jīng)濟的繁榮,人們正在積極地尋找古籍的交換價值。拍賣這種競價交易方式無疑就是一種方便、快捷的買賣方式,也是讓古籍保護贏得社會各界重視、參與的重要渠道。
作為一種特殊的交易對象, 古籍除了具有一般拍賣標的經(jīng)濟價值外, 其獨有文獻價值、歷史價值與審美價值在很大程度上影響甚至決定古籍拍品在拍賣中的成交價格。而對于古籍投資、收藏者來說,更需要了解不同時期古籍版本的收藏價值。建設(shè)古籍版本數(shù)據(jù)庫,挖掘古文獻在版別、版式、結(jié)構(gòu)和裝幀等方面的信息,正是對這些“紙墨俱佳、寫刻俱精”古籍的直觀表征,將極大地推動古籍收藏與市場交易的健康發(fā)展。
2.古籍版本數(shù)據(jù)庫的建設(shè)契機
2007年1月,國務(wù)院辦公廳下發(fā)了《關(guān)于進一步加強古籍保護工作的意見》(國辦發(fā)[2007]6號),要求從2007年開始,在全國范圍內(nèi)組織開展古籍普查工作,全面了解和掌握各級圖書館、博物館等單位及民間所藏古籍情況。作為實施“中華古籍保護計劃”的基礎(chǔ)性工作,全國古籍普查是古籍搶救、保護與利用工作的重要環(huán)節(jié),對登記的古籍進行詳細清點和編目整理,建立中華古籍綜合信息數(shù)據(jù)庫,形成中華古籍聯(lián)合目錄。
古籍普查對古籍版本數(shù)據(jù)庫的開發(fā)提供了千載良機。古籍普查工作對我國存世古籍從數(shù)量、版本、文物價值、文獻價值等方面取得的了第一手資料,每部書都有包括書名、作者、版本、分類、定損、書影等信息的詳細著錄,而這些數(shù)據(jù)都可以直接被古籍版本數(shù)據(jù)庫所采用。同時,《全國古籍普查工作方案》中的相應(yīng)標準及規(guī)范,如古籍普查規(guī)范、古籍書影拍攝相關(guān)規(guī)范、中華古籍總目編目規(guī)則等也都為古籍版本數(shù)據(jù)庫的建設(shè)提供可借鑒的參考。
截止到2010年6月,《國家珍貴古籍名錄》和“全國古籍重點保護單位”已評審并公布三批,其中入選《國家珍貴古籍名錄》的古籍共有9859部,而申報的古籍約有29600部之多,具體統(tǒng)計見下表:
這些申報及入選的古籍都有完整的數(shù)據(jù)及圖版,且多為古籍善本,據(jù)此完全可以制作一個與《國家珍貴古籍名錄》相關(guān)的“古籍版本數(shù)據(jù)庫”。
3.古籍版本數(shù)據(jù)庫的建設(shè)
古籍版本數(shù)據(jù)庫是以古籍版本信息為揭示對象,通過掃描、拍照、縮微膠片等方式對古籍原本進行影像處理,以便為讀者呈現(xiàn)古籍原貌,并提供版本研究的服務(wù)。
古籍版本數(shù)據(jù)庫的開發(fā)對象是古籍各種形式的版本,即古代圖書的實物形態(tài)。表現(xiàn)為一書有各種不同版本的現(xiàn)實,一書各本在形式、內(nèi)容方面的特征和差異,版本的發(fā)生、發(fā)展的歷史,版本的制作、流傳、著錄情況,版本的各種類型,版本的真?zhèn)巍?yōu)劣、價值大小等。因此,為了能夠反映古籍版本的文獻、文物價值,古籍版本數(shù)據(jù)庫可由三方面的基礎(chǔ)數(shù)據(jù)組成,即⑴ 古籍版本的著錄信息;⑵ 古籍書葉的影像信息;⑶ 歷代版本目錄學(xué)著作及相關(guān)工具書。
3.1 古籍版本的著錄信息
對于古籍版本的著錄,主要是將古籍的形式和內(nèi)容特征依據(jù)一定的規(guī)則和方式記錄下來,讓使用者通過記錄的文字能夠了解和確認這部書,從而起到揭示古籍的作用。其信息主要包括:書名項(書名及其卷數(shù))、著者項(作者時代、姓名和著作方式)、版本項(出版時間、地點、版本類別等)、稽核項(冊數(shù)、裝訂形式、紙張、刻工和行款等)、附注項(以上四項的補充內(nèi)容,如批校、題簽、印章等)、提要項(評價書的價值及敘述版刻源流)等內(nèi)容組成。
3.2 古籍書葉的影像信息
古籍書葉的影像信息是指集成能夠反映古籍題名、責(zé)任者、出版年、遞藏歷史等相關(guān)版本信息的書葉影像,從而形象地揭示古籍的真實面貌,為準確地評估古籍版本與相關(guān)版本的比較提供依據(jù)。制作版本書影的目的是要鑒別和證實古籍的版本,因此所采集的影像信息需涵蓋古籍版本的封面、牌記、卷端、版式、藏印、目錄、正文文字及插圖、版心文字、批校題跋等影像資料,從而使古籍的數(shù)字化版本能起到替代原件的作用。
3.3 歷代版本目錄學(xué)著作及相關(guān)工具書
進行版本的收集、鑒定、比較,我們首先要了解古代版本目錄的著錄和研究文獻,熟悉相關(guān)工具書的使用。這是因為古代版本目錄學(xué)著作記載了歷代書籍的情況,如作者的生平、書籍的卷數(shù)、內(nèi)容的體例、版本、流傳、真?zhèn)蔚目急嬉约皩畠?nèi)容與作者的評價等。通過版本目錄學(xué)方面的研究文獻可以了解各類古籍的大概情況及其性質(zhì)、作用,然后可以決定取舍,選擇我們所需要的圖書。因此,在古籍版本數(shù)據(jù)庫中集成相關(guān)版本目錄學(xué)著作及工具書,可以完善數(shù)字化古籍版本的評估、分析體系,以達到對勘版本、梳析源流的作用。
4.古籍版本數(shù)據(jù)庫的建設(shè)原則
4.1 規(guī)范化、標準化原則
規(guī)范化和標準化直接影響著古籍版本數(shù)據(jù)庫的使用效果、存在價值和發(fā)展前景。因此,所開發(fā)的古籍版本數(shù)據(jù)庫一定要依據(jù)國家制訂的古籍保護方面的相關(guān)標準,包括古籍普查規(guī)范、古籍定級標準、中華古籍總目編目規(guī)則,還要參照通行數(shù)字化制作的數(shù)據(jù)著錄標準、古籍書影拍攝相關(guān)規(guī)范、數(shù)據(jù)標引標準、規(guī)范控制標準及各種協(xié)議等,以較成熟的系統(tǒng)軟件和通用標準為技術(shù)平臺來建立標準化、規(guī)范化的古籍版本數(shù)據(jù)庫。
4.2 實用性原則
建設(shè)古籍版本數(shù)據(jù)庫的目的和任務(wù)是為更好地發(fā)揮數(shù)字化古籍版本信息資源的功能,從而準確地揭示和正確地評價古籍版本,最大限度地滿足人們對于古籍版本的各種需求。因此,建庫時應(yīng)遵循“實用性”的原則,充分調(diào)研對于古籍版本的信息需求和處理需求,深入分析版本數(shù)據(jù)庫的實用價值以及社會效益,保證版本數(shù)據(jù)庫能滿足讀者和社會需求,并能進行深層次開發(fā),實現(xiàn)增值效應(yīng)。
4.3 可擴展性原則
古籍版本數(shù)據(jù)庫應(yīng)具有良好的可擴充性、可縮放性和升級能力。首先,中文古籍一直以來沒有一個清楚的數(shù)字,原來曾經(jīng)是多少,現(xiàn)存多少都是未知數(shù)。所以,隨著全國古籍普查工作的深入,而與之相關(guān)的古籍版本的信息量,在一段時期內(nèi)會有一個穩(wěn)定的增長。其次,古籍版本數(shù)據(jù)庫系統(tǒng)本身,要能兼容不同的網(wǎng)絡(luò)平臺,并隨著信息技術(shù)發(fā)展、古籍增值性開發(fā)的需求,實現(xiàn)平穩(wěn)升級及過渡。
4.4 協(xié)調(diào)性原則
為了充分發(fā)揮古籍版本數(shù)據(jù)庫特有的信息優(yōu)勢,避免內(nèi)容貧乏或重復(fù),版本數(shù)據(jù)庫的建設(shè)需要采取協(xié)調(diào)管理,分工協(xié)作,聯(lián)合建庫的方式展開。目前已公布入選《國家珍貴古籍名錄》的9859部古籍,其館藏地分屬國內(nèi)500多家圖書館、博物館。為了加大古籍版本信息的共享性,古籍版本數(shù)據(jù)庫的建設(shè)應(yīng)根據(jù)我國古籍再生性保護的整體需求,有針對性地拓展古籍版本數(shù)據(jù)庫的統(tǒng)籌管理與建設(shè)。
4.5 階段性原則
古籍版本數(shù)據(jù)庫的建設(shè)是一項持續(xù)性工作,并與現(xiàn)階段正在開展的全國古籍普查工作息息相關(guān)。“中華古籍保護計劃”中明確提出要用3到5年時間,在全國范圍內(nèi)開展古籍普查登記工作,全面了解和掌握各級圖書館、博物館等單位及民間所藏古籍情況。在此背景下,古籍版本數(shù)據(jù)庫的建設(shè)也需要制定相應(yīng)建設(shè)目標及中長期規(guī)劃,在取得經(jīng)驗及階段性成果的基礎(chǔ)上,應(yīng)分步發(fā)展,逐步完善。
5.當(dāng)前古籍版本數(shù)據(jù)庫建設(shè)的階段成果
當(dāng)前,古籍?dāng)?shù)字化建設(shè)的成果主要以古籍書目數(shù)據(jù)庫及古籍全文數(shù)據(jù)庫為主。下面所列舉的“古籍版本數(shù)據(jù)庫”,僅是部分或淺層次涉及古籍版本的信息集成,但可以作為古籍版本數(shù)據(jù)庫建設(shè)的階段成果,為接下來的深度挖掘及開發(fā)提供借鑒和參考。
5.1 中華古籍善本國際聯(lián)合書目系統(tǒng)
網(wǎng)址:http://res4.nlc.gov.cn/home/index.trs?channelid=630
“中華古籍善本國際聯(lián)合書目系統(tǒng)”是由中文善本書國際聯(lián)合目錄項目發(fā)展而來的新數(shù)據(jù)庫,主要由美國普林斯頓大學(xué)和中國國家圖書館合作建設(shè)。中文善本書國際聯(lián)合目錄數(shù)據(jù)庫著錄了北美圖書館的幾乎全部藏書以及中國圖書館的部分藏書,數(shù)據(jù)達到2萬多條。在其基礎(chǔ)上建立的新數(shù)據(jù)庫首批公布了普林斯頓大學(xué)東亞圖書館約2000條中文古籍善本數(shù)據(jù),供公眾免費使用,所有用戶均享有檢索、瀏覽、打印、下載本系統(tǒng)書目數(shù)據(jù)及書影。
5.2 臺灣國家圖書館善本叢刊影像先導(dǎo)系統(tǒng)
網(wǎng)址:http://rarebook.ncl.edu.tw/rbook.cgi/frameset1.htm
善本叢刊影像先導(dǎo)系統(tǒng)將臺灣國家圖書館典藏善本古書一萬二千余部中的部分善本,利用拍攝及掃瞄的方式,將善本古書的各葉影像數(shù)字化。內(nèi)容收錄十七種館藏珍貴明人詩文集,各詩文集的書名、撰者、版本、篇名、序跋者、題跋者等數(shù)據(jù)皆可檢索并瀏覽,其書葉影像全部為彩色。
5.3 “學(xué)苑汲古——高校古文獻資源庫”
網(wǎng)址:http://rbsc.calis.edu.cn/aopac/index.htm
“學(xué)苑汲古——高校古文獻資源庫”是一個匯集高校古文獻資源的數(shù)字圖書館,由北京大學(xué)、北京師范大學(xué)、南京大學(xué)、四川大學(xué)等高校圖書館先行合力創(chuàng)建。內(nèi)容不僅包括各參建館所藏古文獻資源的書目記錄,而且還配有部分相應(yīng)的書影或全文圖像。該資源庫中的古文獻類型暫時只有各館館藏善本古籍和普通古籍,今后還要增加金石拓片、輿圖等多種古文獻資源。各館并向讀者提供一定范圍的文獻傳遞服務(wù)。該資源庫為中國高等教育文獻保障系統(tǒng)(CALIS)的特色庫項目之一。
5.4 哈佛大學(xué)哈佛燕京圖書館藏善本特藏資源庫
網(wǎng)址:http://res4.nlc.gov.cn/home/index.trs?channelid=724
中國國家圖書館與美國哈佛大學(xué)圖書館協(xié)議,將共同開發(fā)哈佛燕京圖書館藏中文善本古籍特藏。預(yù)計將用6年時間,完成中文善本古籍4210種51889卷的數(shù)字化拍照。“哈佛大學(xué)哈佛燕京圖書館藏善本特藏資源庫”首批發(fā)布的中文古籍善本及齊如山專藏共204種。該系統(tǒng)可按照書名、著者、出版信息、分類等多維度進行檢索和分類瀏覽,書目信息為中英文對照,更方便海外讀者使用,同時提供全部書影的閱覽,以便于用戶的全面閱讀和深入研究。
5.5 東京大學(xué)東洋文化研究所漢籍全文影像數(shù)據(jù)庫
網(wǎng)址:http://res4.nlc.gov.cn/home/index.trs?channelid=629
東京大學(xué)東洋文化研究所從2002年開始建立古籍全文影像數(shù)據(jù)庫,在互聯(lián)網(wǎng)上免費提供開放性服務(wù)。讀者可按照經(jīng)部、史、子、集四個部分進行分類瀏覽。這批數(shù)據(jù)包括收藏在東洋文化研究所和一些專藏文庫中的珍貴宋、元、明、清善本和民國時期抄本,經(jīng)史子集各類俱全,其中以小說、戲曲為大宗,具有重要的史料價值。
5.6 漢籍?dāng)?shù)字圖書館
網(wǎng)址:http://202.117.149.8
《漢籍?dāng)?shù)字圖書館》(第一閱覽室)內(nèi)涵中文古籍文獻近9萬多種,120余萬卷冊,總頁數(shù)達1622萬頁,目錄系統(tǒng)文字達860萬字,原文獻數(shù)據(jù)量1814GB。該產(chǎn)品由目錄系統(tǒng)和文獻庫兩部分組成。目錄部分采用文本格式,文獻庫采用PDF圖形格式,原版原式、忠實原貌,確保了古籍文獻的準確和應(yīng)用價值。
5.7 長春圖書館“館藏國家珍貴古籍?dāng)?shù)據(jù)庫”
網(wǎng)址:(http://www.lib.cc.jl.cn/guji/index.htm)
作為全國古籍重點保護單位之一的長春圖書館,收藏有大量珍貴古籍善本。該圖書館將已入選《國家珍貴古籍名錄》中的15種、273冊進行數(shù)字化處理,以電子書形式(PDF格式)建成《長春圖書館館藏國家珍貴古籍全文數(shù)據(jù)庫》,供讀者查詢利用。
(作者單位:金陵科技學(xué)院人文學(xué)院 江蘇南京 210038)