利用GIS技術(shù)提升中國(guó)古代文學(xué)研究的數(shù)字化水平
面對(duì)數(shù)字化技術(shù)的日新月異、數(shù)字人文(Humanities? Computing)浪潮的撲面而來(lái),我們坐擁著《文淵閣四庫(kù)全書(shū)》、《國(guó)學(xué)寶典》、《中國(guó)基本古籍庫(kù)》等大型全文檢索古籍?dāng)?shù)據(jù)庫(kù),享受著古籍文獻(xiàn)資料檢索空前快捷的便利,我們還能做些什么?數(shù)字化技術(shù)帶給我們古代文學(xué)研究的,難道僅僅是海量古籍文獻(xiàn)資料的儲(chǔ)存與檢索,我們能不能利用數(shù)字化技術(shù),將古代文學(xué)研究的數(shù)字化水平提升到一個(gè)新的階段?
要提升,要突破,先要了解當(dāng)前古代文學(xué)數(shù)字化存在的問(wèn)題,弄清了問(wèn)題所在,我們才會(huì)有明確的方向和具體的方案來(lái)解決這些問(wèn)題,實(shí)現(xiàn)新的突破與超越。我個(gè)人覺(jué)得,目前與古代文學(xué)研究相關(guān)的古籍?dāng)?shù)據(jù)庫(kù),至少存在著功能單一、范圍有限的問(wèn)題。“功能單一”,是說(shuō)現(xiàn)有的古籍?dāng)?shù)據(jù)庫(kù)只有檢索功能,而沒(méi)有統(tǒng)計(jì)、分析功能,還不能深度挖掘潛藏的信息,不能產(chǎn)生新的知識(shí)。“范圍有限”,是說(shuō)現(xiàn)有古籍?dāng)?shù)據(jù)庫(kù)收錄的范圍主要局限在原始文獻(xiàn)資料方面,沒(méi)有包括20世紀(jì)以來(lái)有關(guān)中國(guó)古代文學(xué)研究的巨量成果。雖然有中國(guó)知網(wǎng)(CNK)可以檢索最新和近期的研究論文,但大量的研究著作還是處在零散的狀態(tài),沒(méi)有集成性的網(wǎng)站或數(shù)據(jù)庫(kù)可以便捷地檢索利用。
就作家作品的編年而言,近些年來(lái),已經(jīng)有了系列的文學(xué)史編年著作,諸如趙逵夫《先秦文學(xué)史編年》(商務(wù)印書(shū)館2010)、劉躍進(jìn)《秦漢文學(xué)編年》(商務(wù)印書(shū)館2006)、曹道衡和劉躍進(jìn)《南北朝文學(xué)編年史》(人民文學(xué)出版社2000)、傅璇琮《唐五代文學(xué)編年史》(遼海出版社1998)、曾棗莊和吳洪澤《宋代文學(xué)編年史》(鳳凰出版社2010)、楊鐮《元代文學(xué)編年史》(山西教育出版社2005)、陳文新《中國(guó)文學(xué)編年史》(湖南人民出版社2006)等。這些編年史,為我們了解各個(gè)歷史時(shí)期文學(xué)的發(fā)展走向與變化歷程提供了豐富的資料和莫大的方便。但受篇幅容量的限制,任何一部斷代文學(xué)編年史,都不可能把所屬時(shí)代的作家生平活動(dòng)和編年作品全部囊括在內(nèi)。文學(xué)編年史只能有選擇性地?cái)⑹銎渲胁糠值淖骷一顒?dòng)和編年作品。至于已有的大全總集文獻(xiàn)如《全上古三代秦漢三國(guó)六朝文》、《先秦漢魏南北朝詩(shī)》、《全唐詩(shī)》、《全唐文》、《全唐五代詞》、《全宋詩(shī)》、《全宋文》、《全宋詞》、《全金詩(shī)》、《全金元詞》、《全元戲曲》、《全元文》、《全明詞》、《全清詞》等斷代總集,基本構(gòu)筑出中國(guó)古代文學(xué)的全景式文獻(xiàn)系列(明清文學(xué)總集尚不全)。這些大全文獻(xiàn)所包含的作家信息資料,也不可能全部融入文學(xué)編年史中。
我們能不能設(shè)想,將上述豐富而零散的歷代總集、各種文學(xué)編年史、相關(guān)研究成果中的作家作品編年資料,進(jìn)行數(shù)字化集成,使之既具有檢索功能,又具有統(tǒng)計(jì)分析功能?
我們認(rèn)為:在現(xiàn)有技術(shù)條件下,完成這一任務(wù),實(shí)現(xiàn)這一構(gòu)想,是完全可行的。本著這一思路,我們聯(lián)合相關(guān)數(shù)字人文領(lǐng)域的專(zhuān)家組成團(tuán)隊(duì),利用地理信息系統(tǒng)(GIS),將我國(guó)浩瀚的、靜態(tài)的、分散的紙質(zhì)文學(xué)史料,進(jìn)行大規(guī)模的數(shù)字化集成、發(fā)布和地圖展示,建立多功能的中國(guó)文學(xué)數(shù)字化地圖資源共享平臺(tái),以深度開(kāi)發(fā)中國(guó)文學(xué)寶庫(kù)中的多元文化價(jià)值,適應(yīng)和滿(mǎn)足數(shù)字化時(shí)代文化建設(shè)、學(xué)術(shù)研究和教學(xué)的深度需求。
中國(guó)文學(xué)數(shù)字化地圖平臺(tái),將文學(xué)紙質(zhì)史料集成化、數(shù)字化、圖表化、可視化,具有資料查詢(xún)、數(shù)據(jù)統(tǒng)計(jì)、地圖生成等功能。平臺(tái)既可以查詢(xún)中國(guó)古今文學(xué)家生平和作品中的重要信息,也可以進(jìn)行分類(lèi)統(tǒng)計(jì),還可以用電子地圖來(lái)呈現(xiàn)統(tǒng)計(jì)結(jié)果。地圖可以顯示每個(gè)時(shí)間點(diǎn)和時(shí)間段中國(guó)各個(gè)地方有哪些作家在此地出生、在此地過(guò)世、在此地活動(dòng)和創(chuàng)作;更可以顯示一個(gè)作家生于何地(或所屬籍貫)、在哪些地方活動(dòng)過(guò),在哪些地方創(chuàng)作了哪些作品、跟哪些人一起交游互動(dòng)。并能按時(shí)間先后順序自動(dòng)生成作家行蹤路線圖。
這個(gè)文學(xué)數(shù)字化地圖平臺(tái),跟我們熟知的《國(guó)學(xué)寶典》、《中國(guó)基本古籍庫(kù)》等古籍?dāng)?shù)據(jù)庫(kù)最大的區(qū)別在于,它具有數(shù)據(jù)處理生成功能。古籍?dāng)?shù)據(jù)庫(kù),是靜態(tài)的,只能全文檢索,不能改變?cè)假Y料的結(jié)構(gòu),不能將原有的資料信息進(jìn)行自動(dòng)重組進(jìn)而生成新的知識(shí)信息。而平臺(tái)則是動(dòng)態(tài)的,能根據(jù)用戶(hù)的需要和指令,自動(dòng)生成新的知識(shí)模塊。比如,我們通過(guò)編年史或文學(xué)家辭典之類(lèi)的工具書(shū),可以按籍貫查詢(xún)和統(tǒng)計(jì)一個(gè)地區(qū)歷史上產(chǎn)出過(guò)多少作家,但我們卻無(wú)法知道歷史上有多少作家曾在這個(gè)地區(qū)活動(dòng)和創(chuàng)作,或者某一個(gè)具體的時(shí)段有哪些作家在這里活動(dòng)過(guò)、創(chuàng)作過(guò)哪些作品?而平臺(tái)可以生成這方面的信息和數(shù)據(jù)。又比如,通過(guò)一個(gè)作家的年譜傳記,我們可以知道他一生中跟哪些人有過(guò)交住、有哪些文壇的朋友,但如果我們要了解同時(shí)的幾個(gè)作家有哪些共同的朋友、作家之間彼此交往的密度和頻度,文學(xué)編年史和作家個(gè)人年譜傳記,都不能給我們提供答案,而平臺(tái)則可以生成這方面的數(shù)據(jù)和圖表。假如我們想要了解蘇軾、黃庭堅(jiān)、秦觀、張耒、晁補(bǔ)之五人之間重疊的交游關(guān)系,平臺(tái)能夠生成我們需要的網(wǎng)狀結(jié)果。
平臺(tái)建成后,會(huì)改變文學(xué)史研究的視角、維度和書(shū)寫(xiě)模式。
目前文學(xué)史的書(shū)寫(xiě),只有時(shí)間的序列性,而沒(méi)有空間的序列性。我們比較清楚每個(gè)時(shí)代文學(xué)史的歷時(shí)性變化,但我們不太清楚每個(gè)時(shí)期文學(xué)史共時(shí)性的空間分布與變化。有了這個(gè)平臺(tái),我們就可以了解歷史上每個(gè)時(shí)段作家作品的地域分布與變化。比如,我們想要了解南宋高宗朝環(huán)太湖流域、或南宋孝宗朝江西路的文學(xué)創(chuàng)作情形,平臺(tái)會(huì)按照我們的要求自動(dòng)生成這個(gè)時(shí)段、區(qū)域內(nèi),有哪些作家在活動(dòng),有哪些作家在場(chǎng),哪些作家在此時(shí)此地寫(xiě)了哪些作品,他們的分布狀況又如何。有了這些資料數(shù)據(jù),對(duì)于各個(gè)區(qū)域的文學(xué)面貌及其發(fā)展變化,就會(huì)了解得更具體和深入。在此基礎(chǔ)上進(jìn)行文學(xué)地理學(xué)、區(qū)域文學(xué)和家族文學(xué)的研究,才會(huì)有具體詳實(shí)的史料來(lái)支撐。有了這個(gè)平臺(tái),就可以從空間維度全面立體地研究文學(xué)史的發(fā)展變化。
還可以利用這個(gè)平臺(tái)從時(shí)間的維度進(jìn)行斷面研究,重新審視和思考文學(xué)史的階段性變化。我們可以任意設(shè)定不同時(shí)代的分期起點(diǎn)、終點(diǎn),不管是分一期還是幾個(gè)時(shí)期,只要給定具體的年代條件,平臺(tái)就會(huì)自動(dòng)生成結(jié)果,告訴我們每期有多少作家、哪些作家、數(shù)量變化曲線等。比如,唐詩(shī),有分三期、四期的,有分五期、六期甚至八段、九段的。我們可以利用平臺(tái)來(lái)觀察唐詩(shī)作家作品的變化曲線,對(duì)已有的各種分期進(jìn)行檢驗(yàn),看哪一種分期較合理,也可以提出新的分期意見(jiàn)。
有了這個(gè)平臺(tái),我們就有可能以十年或二十年為一個(gè)周期來(lái)觀察文學(xué)史的階段性變化。比如盛唐開(kāi)元年間共29年,這二十九年間作家隊(duì)伍、作品創(chuàng)作量有何變化,這個(gè)時(shí)段里,有哪些人進(jìn)場(chǎng),哪些人退場(chǎng),到天寶年間,詩(shī)壇又有什么變化?
對(duì)于政治上南北分割時(shí)段的文學(xué),平臺(tái)更有利于進(jìn)行南北統(tǒng)合的時(shí)段觀察。如1127-1279年間,北方有金元作家在創(chuàng)作,南方有南宋作家在創(chuàng)作,由于受政治史的影響,文學(xué)史的書(shū)寫(xiě)和研究,都是南北分開(kāi)來(lái)觀察。利用這個(gè)平臺(tái),我們就可以知道,有哪些作家是同一年進(jìn)場(chǎng),哪些作家同時(shí)在場(chǎng),哪些作家在同一年進(jìn)行創(chuàng)作;1181-1190年辛棄疾在江西上饒帶湖閑居創(chuàng)造詞史的輝煌時(shí),北方有哪些詞人也在書(shū)寫(xiě)著詞史的新篇章?
總之,這個(gè)平臺(tái),可以從時(shí)間和空間兩個(gè)維度上提供多種觀察文學(xué)的切口和視點(diǎn),不敢說(shuō)能引起文學(xué)研究范式的革命性變化,但開(kāi)拓文學(xué)史研究的新空間、新的增長(zhǎng)點(diǎn),將是完全可以預(yù)期的。
平臺(tái)將十分注重史料數(shù)據(jù)的可靠性、準(zhǔn)確性和科學(xué)性,著力打造一個(gè)具有與紙本文獻(xiàn)同樣可靠可信的數(shù)字化地圖平臺(tái),改變網(wǎng)絡(luò)電子資料不可信據(jù)的局面。