古籍?dāng)?shù)字化應(yīng)以技術(shù)為突破口——兼與程毅中先生商榷
程毅中先生《古籍?dāng)?shù)字化須以古籍整理為基礎(chǔ)》(刊于《光明日報(bào)》4月30日),以國學(xué)公司的電子產(chǎn)品《中國歷代筆記》為例,對古籍?dāng)?shù)字化的基礎(chǔ)進(jìn)行了探討,發(fā)表了看法,也對我們提出了批評。先生能夠?qū)iT探討我們的產(chǎn)品,我感到很高興,也非常感謝。
我與程先生相識已久。多年以來,先生一直對我們的古籍?dāng)?shù)字化給予大力支持和熱情指導(dǎo)。古籍整理不能一蹴而就,我們的古籍?dāng)?shù)據(jù)庫產(chǎn)品也很難一步到位。對于程先生文中所列的問題,我想在此逐一說明。
壹 關(guān)于版本問題。《中國歷代筆記》數(shù)據(jù)庫均有所本,在單機(jī)版的《國學(xué)寶典》中,不但有版本信息,還有書目解題。
貳 關(guān)于序跋問題。按我們的體例,原作者的序跋,一般予以保留;后人所寫序跋,因其非本書的正文內(nèi)容,原則上不予收錄。
叁 關(guān)于書目和版本的選擇問題。為滿足學(xué)術(shù)需要,我們邀請了北京大學(xué)、清華大學(xué)、北京語言大學(xué)、首都師范大學(xué)、東北師范大學(xué)等高校的多位教授擔(dān)綱分卷主編。然而,由于此項(xiàng)工程規(guī)模宏大,掛一漏萬,在所難免。這也正是我們需要與學(xué)術(shù)界共同完成的。
肆 關(guān)于作者的名字問題。由于古籍中書名、人名盤根錯(cuò)節(jié),情況復(fù)雜,古書作者署名混亂,編者未能詳加考證。但凡遇學(xué)者或用戶指出,我們都將及時(shí)更正。《葆光錄》正文誤成《稽神錄》,是程序鏈接錯(cuò)誤。程先生發(fā)現(xiàn)后告訴我們,亡羊補(bǔ)牢,還不算晚。此外,數(shù)據(jù)庫的開放性也是我們產(chǎn)品的特點(diǎn),多年來,我們的產(chǎn)品得益于廣大用戶良多,就在于學(xué)者們在使用過程中及時(shí)反饋意見,使我們能不斷改進(jìn),以臻完善。
伍 關(guān)于“全書沒有統(tǒng)一體例”的問題。程先生在第柒條頭一句話就是“據(jù)U盤的凡例說”,至少表明產(chǎn)品是有凡例的。按《辭海》的解釋,凡例是“說明著作內(nèi)容和編纂體例的文字”。事實(shí)上,《中國歷代筆記》“凡例”對收錄范圍、編目、版本、輯佚、文字、分段標(biāo)點(diǎn)、檢索功能、附錄、卷標(biāo)編碼、人名索引等均有說明,共有15條之多。
陸 關(guān)于“輯集未注出處”的問題。在大型古籍?dāng)?shù)據(jù)庫問世以前,輯佚工作是件難度很大的事;在有大型古籍?dāng)?shù)據(jù)庫之后,輯佚工作難度大大減少,查找時(shí)間大大縮短,主要是內(nèi)容甄別的排序。對輯文一般不注出處,是我們數(shù)據(jù)庫的體例,因?yàn)椴檎疫@些易如反掌。
柒 關(guān)于充分吸收現(xiàn)代人的研究成果與校勘記的問題。對于紙質(zhì)書的出版,國家有一整套統(tǒng)一的出版標(biāo)準(zhǔn)要求;而古籍?dāng)?shù)據(jù)庫尚處于初創(chuàng)階段,在國家尚未制定統(tǒng)一標(biāo)準(zhǔn)的情況下,我們只能自定標(biāo)準(zhǔn),在摸索中前進(jìn)。
程先生舉《朝野僉載》為例,認(rèn)定我們是根據(jù)中華書局整理本錄入并刪除校勘記,此話不妥。《朝野僉載》主要有一卷、五卷、六卷本三個(gè)系統(tǒng),《寶顏堂秘笈》及《四庫全書》本均為六卷。民國石印本《寶顏堂秘笈》并不難得,《四庫全書》全文及圖像版數(shù)據(jù)庫首都師范大學(xué)文學(xué)院購有一套,上海古籍、三秦出版社都出過整理本。我們使用的《寶顏堂秘笈》底本,本來就沒有校勘記,又從何處刪起?改正發(fā)現(xiàn)的錯(cuò)別字,是數(shù)字化流程中的一道工序,是保證古籍質(zhì)量的重要措施,也是我們的基本權(quán)利和義務(wù)。
捌 關(guān)于數(shù)據(jù)庫中的標(biāo)點(diǎn)問題。《中國歷代筆記》總字?jǐn)?shù)逾一億字,如果將這些內(nèi)容排成10萬字一冊的書,足足有一千冊之多。按圖書出版質(zhì)量標(biāo)準(zhǔn)(差錯(cuò)率低于萬分之一,標(biāo)點(diǎn)每處計(jì)0.1個(gè)差錯(cuò)),標(biāo)點(diǎn)差錯(cuò)在10萬以內(nèi)尚屬合格。程先生精心挑選的幾處標(biāo)點(diǎn)錯(cuò)誤,我們已全部改正。一些學(xué)者在使用國學(xué)數(shù)據(jù)庫時(shí),發(fā)現(xiàn)錯(cuò)誤,及時(shí)通報(bào),并囑速改,以免貽誤后人。我對這些品行高尚的學(xué)者心存感激,這是對古籍?dāng)?shù)字化事業(yè)的巨大鞭策和鼓勵。
為了做好古籍?dāng)?shù)字化工作,我不僅踏踏實(shí)實(shí)地做,也一直想在理論上得到證明,集思廣益。
程先生提出的主要觀點(diǎn)是“古籍?dāng)?shù)字化須以古籍整理為基礎(chǔ)”,但以我們研發(fā)數(shù)字產(chǎn)品的實(shí)際經(jīng)驗(yàn)而言,“古籍?dāng)?shù)字化應(yīng)以技術(shù)為突破口”。古籍?dāng)?shù)字化的核心是信息技術(shù),信息技術(shù)是一個(gè)強(qiáng)大的工具,是給現(xiàn)代社會帶來巨大便利的創(chuàng)新工程,是讓所有人都受益的工程。這是傳統(tǒng)的古籍整理不能替代的,也是將來發(fā)展的方向。這就如同傳世文獻(xiàn)從手抄本向印刷本轉(zhuǎn)變的過程一樣,是不可阻擋的潮流。數(shù)據(jù)庫建設(shè)是一個(gè)非常復(fù)雜的系統(tǒng)工程,不僅涉及計(jì)算機(jī)軟件、硬件、數(shù)據(jù)庫結(jié)構(gòu)、數(shù)據(jù)關(guān)聯(lián)、搜索引擎等,還涉及到版本學(xué)、目錄學(xué)、文字學(xué)、文史工具書等。
國學(xué)網(wǎng)從創(chuàng)辦之初就堅(jiān)持嚴(yán)格的技術(shù)要求,也堅(jiān)持嚴(yán)格的學(xué)術(shù)要求。古籍?dāng)?shù)字化起步時(shí)間不長,已經(jīng)顯示出了它的巨大價(jià)值。它在發(fā)展的過程中存在問題,我們隨時(shí)都在改正,而且連改正的方式也遠(yuǎn)比傳統(tǒng)古籍整理的改進(jìn)方式更為先進(jìn)。我們還將投入更多的力量,繼續(xù)拓展古籍?dāng)?shù)字化事業(yè)。目前已有千萬學(xué)者受益于古籍?dāng)?shù)字化成果,程先生也當(dāng)是其中一員,這是令我們引以為傲的事情。如果古籍?dāng)?shù)據(jù)庫被個(gè)別出版社所壟斷,那將導(dǎo)致古籍?dāng)?shù)字化產(chǎn)業(yè)中道崩殂,半途而廢,這不僅會喪失我國在相關(guān)領(lǐng)域的國際領(lǐng)先地位,危及我國的文化安全,也將使我國的學(xué)術(shù)事業(yè)受損。
與傳統(tǒng)的古籍出版事業(yè)相比,古籍?dāng)?shù)字化才剛剛起步;與博大精深的中華傳統(tǒng)文化相比,古籍?dāng)?shù)字化才邁出了萬里長征的第一步。現(xiàn)在有許多出版機(jī)構(gòu)已經(jīng)參與到古籍?dāng)?shù)字化建設(shè)大軍中來,我們愿與所有支持、關(guān)心國學(xué)事業(yè)的單位和個(gè)人合作,共同推進(jìn)古籍?dāng)?shù)字化事業(yè)的發(fā)展,讓中國文化在世界發(fā)揚(yáng)光大。
本文已刊發(fā)于《光明日報(bào)》2013年5月28日第13版
(作者為國學(xué)網(wǎng)總裁、首都師范大學(xué)電子文獻(xiàn)研究所所長)
程毅中先生贈聯(lián)
附:程毅中先生文章(發(fā)表于《光明日報(bào)》2013年4月30日)
古籍?dāng)?shù)字化須以古籍整理為基礎(chǔ)
程毅中
古籍?dāng)?shù)字化是一個(gè)大有前途的文化產(chǎn)業(yè)。目前市場上已有不少古籍?dāng)?shù)字讀物,但往往存在一些質(zhì)量問題和知識產(chǎn)權(quán)問題。
有人認(rèn)為古籍整理只是加了一堆標(biāo)點(diǎn)符號,算不得學(xué)術(shù)著作,也不存在知識產(chǎn)權(quán)問題,因而隨意抄襲和轉(zhuǎn)錄,并制成營利性的商品,從而引起了一些爭議和訴訟。
數(shù)字化的古籍應(yīng)該是經(jīng)過認(rèn)真整理的古籍,需要運(yùn)用目錄、版本、校勘和文字、音韻、歷史文獻(xiàn)等各方面知識進(jìn)行點(diǎn)校,成為現(xiàn)有最好或較好的版本。否則,將會造成謬種流傳,劣本取代善本。但目前流傳的古籍?dāng)?shù)字書,有些卻是未經(jīng)整理和粗制濫造的版本。試以中國國學(xué)出版社2008年11月第一版的《中國歷代筆記》U盤來說,收書很多,號稱有1200多種,逾一億字,信息量很大。真是“一盤在手,坐擁百城”,方便得很。然而,從古籍整理的規(guī)范來衡量,此U盤卻缺點(diǎn)很多,遺憾不少。
為了古籍?dāng)?shù)字書的改進(jìn)和傳播,本文以《中國歷代筆記》U盤(以下簡稱U盤)為例,說明古籍整理的規(guī)范和價(jià)值。
壹 古籍的復(fù)制應(yīng)該說明用的是什么版本。而U盤則一律不說根據(jù)什么版本錄入的,這就丟失了文獻(xiàn)的科學(xué)依據(jù),使人不敢輕易引用。
貳 有些書原有的序跋都被刪掉了,這也使讀者無從了解版本源流的信息。
叁 書目和版本的選擇沒有必要的說明,隨意性很強(qiáng)。例如,唐張鷟的《耳目記》就是一本偽書,實(shí)際上只是抄了《朝野僉載》的幾條文字假托的書名。又如,明無名氏的《巫娥志》,實(shí)際上是李禎(昌祺)《剪燈馀話》里的一篇,原名《江廟泥神記》,這也是假造書名的偽書。又如宋人張君房的《麗情集》是一部佚書,U盤收了十二條殘文,大概是根據(jù)宛委山堂本的“假《說郛》”輯錄的。但《說郛》本引的只是只言片語,很難理解原意。其實(shí),如果要收《麗情集》的話,至少《類說》卷二十九所收的24條佚文,就比《說郛》本還多出許多。再如所收佚名的《燈下閑談》,只有一篇,即原書中的《神仙雪冤》。實(shí)際上原書是兩卷二十篇,有《適園叢書》本和商務(wù)印書館排印的《宋人小說》本,并不難見。明代卷所收李詡的《戒庵漫筆》,只有一卷,實(shí)即李詡《戒庵老人漫筆》的一個(gè)節(jié)選本。為什么不收通行的八卷本呢?楊萬里的《誠齋揮麈錄》《四庫全書總目》提要已考定為王明清《揮麈錄》的節(jié)本,實(shí)屬偽書。U盤收了一些偽書、殘本及單篇文章,而重要的書如《歸田錄》《夢溪筆談》和《剪燈新話》等卻沒有收。
肆 對作者的名字不加核實(shí)。如漢魏晉南北朝卷的《五代新說》,題唐徐炫撰,大概又是沿襲重編本《說郛》之誤,實(shí)應(yīng)據(jù)《郡齋讀書志》作唐張?jiān)児抛S秩缢涡煦C的《稽神錄》,U盤上題作“龍明子”撰(使用手冊上還不誤);而另一種《葆光錄》題下也署名為“龍明子”,實(shí)則原書作者題“襲明子”,原名應(yīng)作“陳纂”,見《直齋書錄解題》。又如元人的《青樓集》一書,題黃雪蓑撰,原書邾經(jīng)序中有“商顏黃公之裔孫曰雪蓑者”的話,前人早已考證出“黃公”是用漢代商山四皓之一“夏黃公”的典故,作者名夏庭芝,字伯和,號雪蓑釣隱。大概編者采用了重編《說郛》本的文字,又把邾經(jīng)的序和夏邦彥的跋刪掉了,使人不知道它是什么版本。上述《葆光錄》一書,內(nèi)容與書名不合,作者之誤還可以說是誤從了《顧氏文房小說》本之訛,而書中正文卻全抄自《稽神錄》,就不知怎么出的錯(cuò)了。
伍 全書沒有統(tǒng)一的體例,如收入了一些單篇的傳奇小說,本來不屬于筆記之列,但是又收得不多。宋遼卷收了趙希弁《讀書附志》,把書目也視為筆記,但《郡齋讀書志》正編卻沒有被列入。又如上述唐人撰的《五代新說》、宋人樂史撰的《綠珠傳》列在漢魏晉南北朝卷,清人萬斯同輯的《庚申君遺事》列在宋遼夏金元卷,按作者年代分卷的體例并沒有貫徹始終。
陸 所收筆記有一部分是佚書,編者加以輯集,當(dāng)然很好。如唐五代小說的佚文,有《太平廣記索引》和李劍國的《唐五代志怪傳奇敘錄》可以參考,不難照錄。但令人費(fèi)解的是往往不注出處,湮沒來源,就不能使讀者信賴了。例如戴孚《廣異記》已是佚書,U盤所收都據(jù)《太平廣記》輯出,可是一概不注書名、卷數(shù)。《廣異記》雖有抄本流傳,但所輯不全,現(xiàn)有方詩銘重輯本較為完備,U盤所收與之基本相同,卻把出處全刪了。李劍國、方詩銘還從《類說》輯出兩條佚文,又沒有利用。他如牛肅《紀(jì)聞》、李亢《獨(dú)異志》、張讀《宣室志》等書也是如此,既不說明版本,又沒說明佚文出處,令人無從了解書的來源。
柒 據(jù)U盤的凡例說,曾“盡量吸收前人的研究成果”,實(shí)際上應(yīng)該是盡量吸收現(xiàn)代人的成果,但又沒能充分吸收。古籍的點(diǎn)校本一般是有校勘記的,U盤則只吸收了他們的校改成果,而把校勘記刪了,這樣就使讀者不知道它用的是什么底本,更不知道它的文字是根據(jù)什么版本改的。例如《朝野僉載》一書,中華書局版趙守儼點(diǎn)校本以《寶顏堂秘笈》本為底本,與《太平廣記》等書對校,并作了許多補(bǔ)輯工作。U盤的正文就照改了那些校改的文字,例如第二條“藏曰夫人目長而漫視”,第五條“而刑部尚書李日知”,第十三條“試著口即死”等字句,都有校勘記說明改字的依據(jù),而U盤卻全部刪除了。更令人困惑的是,趙守儼從《酉陽雜俎》等書輯出的“補(bǔ)輯”一卷,U盤也全部照收,附在第六卷之后,而全都刪掉了出處。再如《北夢瑣言》一書,上海古籍出版社版林艾園校點(diǎn)本也有許多校改和校勘記,照錄了它的正文,又刪掉了校勘記,而且還把底本(《云自在龕叢書》本)原有逸文四卷的出處也一起刪掉了。徐鉉《稽神錄》一書,已有白化文先生的點(diǎn)校本,U盤吸收了他的“再補(bǔ)”,卻改注為李劍國、程毅中補(bǔ)輯的,這就不免有掩耳盜鈴的嫌疑了。
捌 歷代筆記的標(biāo)點(diǎn),不少書有中華書局“歷代史料筆記叢刊”和上海古籍出版社“筆記小說大觀”等點(diǎn)校本可以參考,錯(cuò)誤還不算太多。但有些未經(jīng)整理的書,標(biāo)點(diǎn)就出現(xiàn)不少失誤。這里舉一些比較明顯的例子,略加分析,以見一斑:
帝不得已而行,竊謂人曰:“匈奴為害自,古患之,周秦及漢魏,歷代所不能攘,相為勍敵者也。”(B005《大唐創(chuàng)業(yè)起居注》)
按:“自”字顯然不能讀斷,逗號應(yīng)移上。
又曰:“吾不試故藝,試用也”。夫藝者,不獨(dú)總多能第,以其無用于代,而窮愁時(shí)有所述耳。(B006《大唐傳載》)
按:“吾不試,故藝。”是《論語·子罕》記孔子的話。“試者,用也。”見于《論衡·正說篇》,是注釋者引用的話,“試”字下應(yīng)加逗號。“第”,但也,在這里是一個(gè)副詞,應(yīng)屬下句。
任昉序《王儉集》有攻乎?異端歸之正義,可見攻字從攻擊之攻。(D119《談輅》)
按:“攻乎異端”是出于《論語·為政》的一句成語,不能見到“乎”字就加問號。“端”字下應(yīng)加逗號,“攻乎異端,歸之正義”兩句是任昉的話,應(yīng)加引號。
文選王簡《棲頭陀寺碑》文,有云:層軒延袤,上出云霓。(D255《半村野人閑談》)
按:“文選”是書名,“王簡棲”是人名,《頭陀寺碑文》見蕭統(tǒng)《文選》卷五十九。如果查一下書,就不會讀錯(cuò)了。
潛言皇上聯(lián)云:“禮樂征伐自,天子出。”(D304《金聲巧聯(lián)》)
按:這句話出于《論語·季氏》,孔子曰:“天下有道,則禮樂征伐自天子出;天下無道,則禮樂征伐自諸侯出。”在“自”字下斷句又怎么講呢?
從《中國歷代筆記》U盤的一些缺點(diǎn)可以看出,有些數(shù)字化古籍之所以不能使人信賴,就在于未經(jīng)學(xué)者的認(rèn)真整理,或者是借用了已經(jīng)整理的版本而又亂加刪改,藏頭露尾,買櫝還珠,造成了許多混亂。
數(shù)字化的古籍雖然使用方便,但有些書還不符合古籍整理的規(guī)范。除了要繼續(xù)提高電腦技術(shù)之外,更需要加強(qiáng)“人腦”的文化素養(yǎng)和學(xué)術(shù)含量。古籍的數(shù)字化必須盡量吸收和保護(hù)古籍整理的成果。目前不少出版社正在積極進(jìn)行數(shù)字書的出版,這方面的經(jīng)驗(yàn)教訓(xùn)值得借鑒。