李先耕
(黑龍江大學(xué)古籍所)
隨著中文信息化進(jìn)程的發(fā)展,“電子版”或“數(shù)字化”中文古籍也越來(lái)越普及流行。從載體介質(zhì)上來(lái)分,有軟盤(pán)版(這是早期產(chǎn)品,現(xiàn)在已極罕見(jiàn))、光盤(pán)版(包括DVD光盤(pán)與CD光盤(pán))、硬盤(pán)版、U盤(pán)版以及網(wǎng)絡(luò)版等等。從內(nèi)容表現(xiàn)形式上來(lái)分,有圖像版與文字版之分。不論圖像版還是文字版,都屬于古籍整理工作,其成果自然有好壞優(yōu)劣之分,也就是是否為善本電子版古籍。
【首先要說(shuō)明的是,原有的善本書(shū)的概念有兩個(gè)方面的含義,一是文物方面,如宋元刻本(《中國(guó)古籍善本書(shū)目》收至清乾隆刻本),一是校勘精審的古籍。本文所指當(dāng)然是后一種!
圖像版電子古籍可以說(shuō)與古籍善本縮微膠片以及影印版古籍有相似之處。影印古籍是源于古籍的影寫(xiě)本與覆刻本(或稱(chēng)影刻本、仿刻本),如清末黎庶昌編刻的《古逸叢書(shū)》就是十分逼真的覆刻本。而當(dāng)石印技術(shù)、珂羅版技術(shù)傳入中國(guó)后,也就利用這些技術(shù)來(lái)重印或縮印古籍。如同文書(shū)局石印的以武英殿銅活字本爲(wèi)底本的《古今圖書(shū)集成》,董康珂羅版印制的《劉夢(mèng)得文集》,商務(wù)印書(shū)館的《續(xù)古逸叢書(shū)》。而現(xiàn)在則可以先用照相制版或電腦掃描制版再采用膠印或其他印刷方法完成。如中華書(shū)局的《古逸叢書(shū)三編》。而北京圖書(shū)館出版社的《中華再造善本》更是達(dá)到了把珍稀的孤本、善本化身千百,妥善保護(hù)的境地,使得各省市的讀者有幸看到以前終生難見(jiàn)的古籍善本?梢哉f(shuō),目前的古籍影印工作已較成熟,中華書(shū)局總編室的《古籍影印釋例》就是基本規(guī)范。其中對(duì)“合格的古籍影印本”有如下要求:“(1)所采用的底本具有一定的學(xué)術(shù)價(jià)值;(2)參校他本作出?庇洠唬ǎ常┯凶阋苑从钞(dāng)代研究成果的序文(或稱(chēng)前言、出版說(shuō)明);(4)正文有斷句或新式標(biāo)點(diǎn);(5)編制有新的目錄或索引;(6)附錄有相關(guān)研究資料!币源藖(lái)看,今天的圖像版電子古籍仍有不小的差距。目前廣為流傳的電子版古籍,如武漢大學(xué)出版社的光盤(pán)圖像版《文淵閣四庫(kù)全書(shū)》、超星的網(wǎng)絡(luò)版《四庫(kù)存目叢書(shū)》,高等學(xué)校中英文數(shù)字化國(guó)際合作計(jì)劃(CADAL)的網(wǎng)絡(luò)版《續(xù)修四庫(kù)全書(shū)》等等都是具有代表性的大型叢書(shū)型電子版古籍,即對(duì)現(xiàn)有的紙本影印本古籍加以數(shù)字化制作。但事實(shí)上無(wú)論是電子書(shū)標(biāo)準(zhǔn)、底本選擇還是數(shù)字化制作本身都存在一定問(wèn)題。就以前述三家為例,其文件格式不同,為了閱讀就不得不安裝幾種不同的閱讀器。其他文件格式,包括方正的CEB文件、書(shū)生的SEP文件、知網(wǎng)的CAJ文件等等,據(jù)說(shuō)目前國(guó)內(nèi)的電子書(shū)文件大約有二十余種,這當(dāng)然不利于電子書(shū)的應(yīng)用傳播。盡管2008年11月,由中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)聯(lián)合多家國(guó)內(nèi)軟件公司制定的電子文檔互聯(lián)互通接口標(biāo)準(zhǔn)UOML,已被國(guó)際開(kāi)放標(biāo)準(zhǔn)組織OASIS列為正式標(biāo)準(zhǔn)。但目前我們看到的各個(gè)利益集團(tuán)仍然是各行其是,電子書(shū)標(biāo)準(zhǔn)的真正統(tǒng)一似乎仍需時(shí)日。至于選擇底本,這是任何一項(xiàng)古籍整理工作都必須注意的問(wèn)題,這里就不加論述了,只是希望有關(guān)從事古籍電子書(shū)工作的單位能首先做好有關(guān)的文獻(xiàn)摸底與選擇工作,而不是隨便拿過(guò)一本古籍就來(lái)“數(shù)字化”。數(shù)字化古籍的制作是需要專(zhuān)用的工具設(shè)備才能更好地完成。2007年筆者在浙江大學(xué)圖書(shū)館參觀CADAL項(xiàng)目工作的時(shí)候,對(duì)其規(guī)模之大,設(shè)備之精有深刻印象。下面是當(dāng)時(shí)的兩張照片,插在這里以資介紹:第一張是其工作現(xiàn)場(chǎng),幾十位工作人員正在認(rèn)真工作;第二張是工作人員正在用西門(mén)子專(zhuān)業(yè)掃描儀調(diào)整所掃描古籍的圖像。
下面要談到的是文字化中文數(shù)字古籍,它所具有的最大優(yōu)點(diǎn)就是能夠準(zhǔn)確地進(jìn)行全文檢索。如北京國(guó)學(xué)時(shí)代文化傳播股份有限公司1999年推出的《國(guó)學(xué)寶典》,香港迪志文化出版有限公司和上海人民出版社1999年的《文淵閣四庫(kù)全書(shū)電子版》,廣西金海灣音像出版社與廣西師范大學(xué)出版社1999年聯(lián)合出版的《古今圖書(shū)集成》。此后北京書(shū)同文數(shù)字化技術(shù)有限公司2002年的《四部叢刊》全文檢索版,北京龍戴特信息技術(shù)有限公司與北京時(shí)代瀚堂科技有限公司聯(lián)合開(kāi)發(fā)的“龍語(yǔ)翰堂典籍?dāng)?shù)據(jù)庫(kù)”及相關(guān)技術(shù)系列產(chǎn)品等等。其中《國(guó)學(xué)寶典》、《四部叢刊》、《四庫(kù)全書(shū)》都不斷推出新版甚至新的網(wǎng)絡(luò)版。新版會(huì)糾正原有版本的錯(cuò)誤,有的如《國(guó)學(xué)寶典》、“龍語(yǔ)翰堂典籍?dāng)?shù)據(jù)庫(kù)”還會(huì)增加其文獻(xiàn)內(nèi)容。就《四庫(kù)全書(shū)》、《四部叢刊》電子版來(lái)講。不存在底本的版本問(wèn)題,所以其新版就是強(qiáng)化功能、改進(jìn)技術(shù)以及糾正原來(lái)錄入的錯(cuò)誤。我們知道,無(wú)論是人工錄入還是掃描圖像辨識(shí)都有一定的錯(cuò)誤產(chǎn)生。前人云,校書(shū)如掃落葉,才掃卻又生。100%的正確幾乎是不可能的,所以一開(kāi)始《四庫(kù)全書(shū)》與《四部叢刊》在全文檢索版中都包含了圖像版,使得學(xué)術(shù)研究者引用時(shí)能方便地核對(duì)原文。但其最初推出時(shí)普通的計(jì)算機(jī)硬盤(pán)容量難以有力地支持圖像版,而且學(xué)界浮躁之風(fēng)也使得許多使用者無(wú)心核對(duì)。而現(xiàn)今的網(wǎng)絡(luò)版一般多提供全文檢索功能,而少有同時(shí)顯現(xiàn)原文圖像者。這就再一次強(qiáng)調(diào)文字版的正確率是多么重要。但是即使與底本100%相同,沒(méi)有任何錯(cuò)誤,研究者在引用時(shí)仍然會(huì)面臨字庫(kù)范圍與現(xiàn)行規(guī)范的種種要求。比如《四庫(kù)全書(shū)》中的避諱缺筆字在其字庫(kù)中有,但一般的計(jì)算機(jī)并沒(méi)有安裝這一特定字庫(kù),所以是無(wú)法顯現(xiàn)的。而現(xiàn)行的文字規(guī)范,無(wú)論是字型規(guī)范還是異體字整理要求都會(huì)對(duì)文字化中文數(shù)字古籍使用發(fā)生影響。即使是紙本古籍的整理這方面的加工也是不可避免的。中華書(shū)局總編室在其《古籍校點(diǎn)釋例》中就說(shuō):“古書(shū)中的古今字、通假字、異體字、俗體字等,一律不出校。宋代以前的古書(shū)及有關(guān)語(yǔ)言文字學(xué)的著作,異體字一般不改。元明以後的書(shū),不常見(jiàn)的異體字及不合規(guī)範(fàn)的俗體字,如「島」作「」,「沿」作「
」、「惡」作「悪」、「船」作「舡」、「銜」作「啣」之類(lèi),可根據(jù)實(shí)際情況改成通行的繁體字,改了也不出校。版刻中的錯(cuò)字,如「焰」刻作「熖」、「祇」(只)刻作「秖」、「千」刻作「
」、「餐」刻作「飱」,「寤寐」刻作「窹
」之類(lèi),應(yīng)改成規(guī)範(fàn)的繁體字。一本書(shū)內(nèi)的用字應(yīng)力求統(tǒng)一。用簡(jiǎn)體字排印的書(shū)可另作規(guī)定。”只有經(jīng)過(guò)這些整理加工后的古籍,才能正式出版。我們認(rèn)為今天的文字化中文數(shù)字古籍善本也必須經(jīng)過(guò)這樣的處理。
這里要說(shuō)明的是,《國(guó)學(xué)寶典》系列產(chǎn)品多是簡(jiǎn)體字,這能否稱(chēng)為善本呢?我們以為書(shū)籍的載體與字體本來(lái)就是與時(shí)俱進(jìn)不斷變化的,這并不影響其是否能成為善本。古書(shū)本來(lái)是“書(shū)於竹帛”(《墨子》),其載體是竹簡(jiǎn)(其長(zhǎng)度標(biāo)準(zhǔn)隨不同的內(nèi)容分類(lèi)而變化)、木牘與縑帛(其標(biāo)準(zhǔn)長(zhǎng)度是四丈),其字體是戰(zhàn)國(guó)古文、小篆、隸書(shū),其裝訂是編連成冊(cè)與折疊舒卷。紙張發(fā)明之后成為書(shū)籍的主要載體,可以書(shū)寫(xiě)各種字體,特別是后來(lái)流行的草書(shū)、行書(shū)、楷書(shū)。印刷術(shù)發(fā)明前的鈔本多是卷軸裝,當(dāng)時(shí)尚未有“善本”之名,但各種形式的“石經(jīng)”成為那時(shí)的規(guī)范標(biāo)準(zhǔn)。而印刷術(shù)發(fā)明之后,馮道首先用來(lái)印刷經(jīng)籍也成為當(dāng)時(shí)的規(guī)范。而字體也從仿效書(shū)法家的楷體字(即所謂軟體字)逐漸演變?yōu)楸阌诘癜娴挠搀w字(它濫觴于宋最終成熟于明季,就是“宋體字”——臺(tái)灣稱(chēng)之為“明體字”[1])。而1965年頒布的《印刷通用漢字字形表》,當(dāng)時(shí)遵循的原則是“同一個(gè)宋體字有不同筆畫(huà)或不同結(jié)構(gòu)的,選擇一個(gè)便于辨認(rèn)、便于書(shū)寫(xiě)的字體,同一個(gè)字宋體或手寫(xiě)楷書(shū)筆畫(huà)結(jié)構(gòu)不同的,宋體盡可能接近手寫(xiě)楷書(shū),不完全根據(jù)文字學(xué)的傳統(tǒng)。”為什么這一“新字形”舍棄了雕版印刷長(zhǎng)期形成的宋體字傳統(tǒng)呢?因?yàn)檫@時(shí)已不用全部雕刻木板而變成鑄造鉛字字模了。宋體字的易于雕刻的原則才能讓位于“便于辨認(rèn)、便于書(shū)寫(xiě)”和“接近手寫(xiě)楷書(shū)”的原則。對(duì)于今天的電子版古籍字庫(kù)來(lái)說(shuō),可以由專(zhuān)業(yè)機(jī)構(gòu)制定各種專(zhuān)門(mén)字庫(kù),甚至隸書(shū)、小篆以至甲骨文、金文、戰(zhàn)國(guó)古文等古文字字形。在這種情況下,按照《中華人民共和國(guó)通用語(yǔ)言文字法》,一方面“學(xué)校及其他教育機(jī)構(gòu)以普通話和規(guī)范漢字為基本的教育教學(xué)用語(yǔ)用字”,即中小學(xué)的文言文教學(xué)都是使用規(guī)范漢字(包括簡(jiǎn)化字),其實(shí)大學(xué)各科教學(xué),除了中文系的古代漢語(yǔ)與古代文學(xué)文選使用繁體字之外,都是簡(jiǎn)化字。所以《國(guó)學(xué)寶典》恰恰同這一教育傳統(tǒng)接軌,有利于廣大使用者更好地接近傳統(tǒng),認(rèn)識(shí)古典。另一方面,該法律也規(guī)定了在“出版、教學(xué)、研究中需要使用的”情況下,可以使用異體字、繁體字。這就使得諸如《四部叢刊》、《四庫(kù)全書(shū)》之類(lèi)的繁體字電子版古籍也有了合法存在的理由。當(dāng)然如前所述,即使是繁體字古籍,同樣也要經(jīng)過(guò)一定的校勘與字形處理。而使用簡(jiǎn)化字的電子版古籍,我們以為應(yīng)該同紙本古籍一樣,基本上應(yīng)以重新發(fā)表的《簡(jiǎn)化字總表》為準(zhǔn),而不應(yīng)該無(wú)限類(lèi)推[2]。如果可能的話,可以利用現(xiàn)行字庫(kù),適當(dāng)?shù)叵承┖?jiǎn)繁“一對(duì)多”所引起的困惑。比如繁體的“錢(qián)鍾書(shū)”,可以寫(xiě)成簡(jiǎn)體的“錢(qián)鍾書(shū)”,而不必一定要寫(xiě)成“錢(qián)鐘書(shū)”。即以“鍾”為“鍾”的簡(jiǎn)化字,而以“鐘”為“鐘”的簡(jiǎn)化字。因?yàn)椤版R”當(dāng)“鍾聚”、“鍾愛(ài)”講,而“鐘”卻沒(méi)有這一義項(xiàng)[3]。
總之,文字版電子古籍,無(wú)論使用字庫(kù)為簡(jiǎn)體或繁體,只要底本選擇的好,校勘精審,都可以成為善本。
注釋?zhuān)?/strong>
[1]參見(jiàn)王立軍:《雕版印刷對(duì)印刷字體的影響》,見(jiàn)商務(wù)印書(shū)館《漢字字形研究》2004年北京。
[2] 李先耕:《簡(jiǎn)化字應(yīng)否無(wú)限類(lèi)推》,見(jiàn)《求是學(xué)刊》2002.2期。
[3] 這一觀點(diǎn)較筆者《關(guān)于漢字簡(jiǎn)化“后退”的思考》(見(jiàn)《語(yǔ)言規(guī)劃的理論與實(shí)踐》,語(yǔ)文出版社2006年)一文有所松動(dòng)。
發(fā)布日期:2009-08-18