“數字人文”視野中的目錄之學 ——以中國現代、當代文學目錄為討論對象
來源:《澳門文獻信息學刊》 | 王賀 2020年03月26日09:19
2019年3月19日,拙文《目錄學向何處去》在《上海書評》發表。發表后,許多師長、朋友慷慨提供了不少意見、建議。這些精彩的意見、建議,約略可歸納為二方面:一是針對此文具體所論《新月》目錄、索引及復旦大學分校中文系資料室編印《〈新月〉目錄索引》而補充、提示新的研究資料和研究線索、來源。這些補充和提示,不可謂不重要,因學術研究的任務之一,乃是向讀者提供新的、盡可能準確的知識。不過,由于我尚未完全掌握這些新的資料和采訪對象等,目前無法作出進一步的、全面的補充與修正。二是因此而生發出的,關于現時代目錄學之意義、價值如何認識,中西目錄學學術傳統如何評估等等相關問題的討論。這些問題,拙論其實并未充分展開,其間寥寥數語,似亦不免理有未周、意猶未盡,故此再作若干分析、解釋,以免謬種流傳而不自度,且以售其欺者耳。
拙文嘗謂:“在互聯網搜索引擎和數據庫出現之后,絕大多數目錄、索引的工作都已被自動生成的檢索結果和在線‘機讀目錄’等形式取代。作為專門之學的傳統的目錄學(這是就其狹義而言的,并非是指‘辨章學術、考鏡源流’的廣義的目錄學),固然在古籍整理、研究中不斷發展,但面對《新月》在內的近現代文獻,面對新的學術與知識生態,已在很大程度上喪失了實用性、當代性,而使自身成果成為了資料室、圖書館中的‘遺跡’,乏人問津;面對當代浩瀚無邊、旋起旋滅的網絡文獻,更使人感到任何人力編制一目錄、索引的徒勞、無力。”
又稱:“如果說目錄的歷史漫長而悠遠,那么,索引自誕生之日起,堪稱知識分類生產的新工具,被發明用于加工、利用原始文獻資料。作為‘二次文獻’的索引,極大地提高了知識生產的效率,促進了知識的積累、學術的發展,拓展了人類思維的疆界,將其譽之為全球知識史、文明史上的一大革命,也毫不夸張,但如今美人遲暮、英雄難有用武之地,其前路何在,不得不引人深長思之。”
凡此種種,似乎給讀者留下了我竭力否定目錄學的實際功能、價值的印象。事實上,學界對目錄、索引類著作的一般性批評,并非始自拙文,而前輩學人雖未有專門撰文,但在其具體批評中仍涉及到此類工作的一些根本問題,如周一良在自藏《世說新語引得(附劉注引書引得)》(系洪業主持之哈佛燕京“引得編纂處校訂”之《引得》第12號,于1933年5月由“哈佛燕京學社”出版)一書即有如此批語: “世說一書不可解處太多,此引得僅就可解項目編制,不可解者仍付缺如,為用殊狹耳。” “劉注只有引書引得,亦為美中不足。”雖寥寥數語,卻點出了索引編制的內在缺陷。更何況作為一種發展趨勢,目錄學在互聯網、數據庫時代遭遇了嚴重挑戰,其所面臨的危機是無可否認、毋庸置疑的,不過,正如我在另一論及校勘學研究方法的短札中所言,這并不意味著其已淪落到人人可哂、殆無足觀的地步,相關的工作也已不可被視作嚴肅的學術工作,相反,仍存在著不少有待今人深入思考、努力開拓的空間。校勘學如此,其他的傳統文獻學的分支領域,何嘗不是如此?
(一)目錄、索引在現時代之意義及其功用
首先,有必要強調的是,對于任一迄未建立數據庫的文獻資料,目錄、索引仍有其存在價值。例如,1951年9月24日,前蘇聯作家愛倫堡、智利詩人聶魯達等作為“世界和平理事會”、“加強國際和平”斯大林國際獎金委員會代表訪問上海。到滬當日下午,即參觀虹口區大陸新村魯迅故居、魯迅紀念館,并與陪同的丁玲、周而復等人合影留念。參觀結束后,愛倫堡夫婦、聶魯達夫婦在該館紀念冊上題詞,中云: “魯迅雖然沒有看到新時代的新事物,但他是培養新時代新事物的人!”之后,愛倫堡夫婦由陳虞松等陪同參觀了新華印刷廠,聶魯達夫婦由黃華等陪同參觀了水生生物研究所。當晚還一道出席了由中華人民保衛世界和平反對美國侵略委員會華東總分會暨上海市分會、中蘇友好協會上海分會、中華全國總工會華東辦事處、上海總工會、上海市民主婦女聯合會、上海市文學藝術界聯合會等多個團體聯合舉辦的招待晚宴。唐弢為此還在《解放日報》發表雜文《新的鼓舞》,對二人到訪上海表示熱烈歡迎,謳歌來之不易的國際友誼,表達對世界和平的期許。
然而,關于此一史事,透過“讀秀學術搜索”“中國知網”“谷歌學術”等各大學術搜索引擎,我們只能查得三條記錄。其中之一即來自李萬春編《蘇聯當代文學研究資料索引》的《愛倫堡、聶魯達參觀上海魯迅紀念館》。據該書所示,此文原載《文藝新地》1951年第10期,但是,包括《文藝新地》在內的大量當代報刊,幾乎很少被建置為數據庫,故此我們只得循此線索至圖書館查詢原刊,以順利獲得全文。然而,如果沒有這一專題索引,我們焉能看到這一研究資料?此外,上海《文匯報》1951年9月25日頭版也發表了題為《訪問人民的新上海 愛倫堡與聶魯達昨抵滬》的消息,并載有該報記者徐開壘的報道《愛倫堡與聶魯達訪問魯迅紀念館》,述之甚詳,足供參考。《文匯報》《人民日報》《光明日報》等大報,盡管早已建成各自的數據庫或光盤版全文檢索系統,但或需要圖書館采購,或需要購買、安裝光盤才能使用,且未能進入各大學術搜索引擎,因此較難為學者所利用,而三十多年前問世的《蘇聯當代文學研究資料索引》,在此正體現出它不衰的價值。
在許多學者和讀書人的認識、想象中,越是古老的文獻越不容易找到,似已是一定論,若欲查找當代文獻,又何愁之有?但以上的實例就告訴我們,諸如《文藝新地》等等當代文獻,仍需要我們為之建立專題目錄、索引;而當代文獻的大宗——網絡文獻,更以其生命周期短、每天以高速度增長、傳輸介質的不穩定性等等原因,導致其難以有效保存,致使后之來者難以利用。與此相比,既有的“互聯網檔案館”(Internet Archive)等旨在定期收錄、永久保存全球網頁的網站、項目所取得的成就,則顯得微不足道。也正因為我們長期以來崇古而卑今的文獻意識(刻板印象?)作祟,學界中人每每語及當代文獻,雖不必棄之如敝屣,但談到其搜集、保存及整理工作,恐怕很難不表示不置可否的態度;而不重視閱讀、利用專題目錄、研究資料索引等書的結果,便是坊間流行的一些關于“愛倫堡在中國”“聶魯達與中國”的研究,在一定程度上失去了基礎資料的支撐,從而無法進行起碼的史實重建,更無論就相關問題進行分析、解釋與論證,當然也很難構成堅實、有效的學術積累,何其憾也。
(二)圖書館在線“機讀目錄”等目錄之局限
其次,面對圖書館的在線“機讀目錄”(MARC)或藉由搜索引擎和數據庫自動生成的條列式檢索結果,我們固然有充足的理由為之額手稱慶,但也同時必須承認其有限性。例如,2007年3月8日,意大利作家、學者翁貝托·埃科(一譯艾柯)結束北京之行,蒞臨上海,次日在上海書城參加其新作《波多里諾》中譯本發布活動。與其1993年首次訪華、在北京大學發表《獨角獸與龍》的學術演講不同,這次埃柯還接受了許多新聞媒體的采訪,也與普通讀者有較多交流機會。其中,發表于同年3月15日《南方周末》的專訪,不僅有兩個專版,而且思想、內容深刻,問世后引發不少關注。通過搜索引擎,我們可以清楚地掌握這一專訪的基本信息,甚至知道這一專訪的超鏈接地址,指向該報官方網站的某一頁面,但是,當我們試圖重新訪問時,卻發現該地址已經失效。實際上,在該報官方網站和其他種種來源上,都完全查找不到這一專訪的內容,最后仍只能到圖書館中去查檢原報。
復旦大學圖書館聯機目錄中的《南方周末》
一旦我們想要進入圖書館查檢原報,就必須通過查詢圖書館在線“機讀目錄”、確認其是否已納入館藏這一程序。但是,正如我們所知,在圖書館“機讀目錄”中,一份報紙無論發行時間多長、總數有多少張、合訂本有多少冊,一般可能只有一個條目。在這一條目之下,除題目、著者等一般著錄的字段,也還羅列有館方依其發行年限或其他標準加工而成的各個合訂本的所謂“詳細書目記錄”,但很明顯,這仍然無法深入我們所需要的具體的某篇文獻。試想,假如沒有之前獲得的具體的發表時間等等信息,如何查找這篇專訪資料?無異于大海撈針。然而,這一切,恰是專門的目錄、索引可以派上用場的地方。不僅如此,正如北京大學中古史研究中心的史睿兄評論拙文時所指出的:“產生于計算機信息處理技術發展初期的機讀目錄,早已遠遠落后于當今信息處理技術發展水平,就知識體系而言不及紙本目錄,就直指關鍵詞檢索而言不及紙本索引等檢索工具書。”而且“目前圖書館的機讀目錄表面上便于檢索,因其完全無序(書目內在意義的順序),其實是取消了傳統目錄‘即類求書’功能,更不要說用以‘辨章學術、考鏡源流’了。”
這也意味著我們需要更加充分、自覺地認識圖書館“機讀目錄”的成就與不足。作為圖書館系統編制書目數據所遵循的作業規范和描述、揭示文獻信息的國際標準格式,“機讀目錄”較數千年流行的“卡片目錄”,在很多方面的確更勝一籌,其最大的長處即在于利用機器(電腦)識讀和處理圖書信息,并根據一定的編目規則、格式及編制方法,自動生成書目信息,為讀者快速查詢、圖書分類與書目數據資源的共享奠定了基礎,極大地節省了人力、物力和財力,但自其誕生發展至今,亦已暴露出不少局限性,無法滿足讀者深入單一、個別文獻乃至“即類求書”“辨章學術、考鏡源流”的需求,正是其一大不足。
另一方面,圖書館“機讀目錄”中的許多著錄項、字段因可由出版機構、圖書代理商提供,或與之合作取得(據我所知,近年來,中國大陸許多圖書館的編目業務已由外包公司承擔),館方只待其完成初稿之后,再交由正式的圖書編目員稍作校對,便匯入書目系統,但此一整合與共享書目數據之舉,究竟是技術革新所取得的進步,還是說明此一工作已漸失其專業水準、門檻,從而化為圖書館學實務之一附庸?如何滿足圖書館讀者不同層次的“目錄”需求,兼顧其對權威與可信數據的需求?如何克服日益增長著的文獻(及其信息)與讀者“對文獻特定需求之間的矛盾”?仍值得思考。
但無論如何,讀者都必須面對、利用這一不盡如人意的“機讀目錄”。史睿兄因此感慨道:“從這個角度說來,當今圖書館讀者被機讀目錄誤導,知識管理能力尚不及古人。此今日圖書館極為可悲可哀之事,今之圖書館人‘不暇自哀而后人哀之,后人哀之而不鑒之,亦使后人而復哀后人也’。”更進一步,“需要詰問的是:技術轉型真的帶來文明提升嗎?至少在圖書館目錄這件事上我們看到的是,技術轉型帶來了讀者知識管理方式的喪失和知識管理能力的下降。這表明圖書館絕非是幾位二五眼的程序員能包打天下的。學者們抗拒‘數字化’,其實根子在此。”
令人憂心的是,無論是在線“機讀目錄”,還是全文數據庫及其相關的“數字人文”研究工具的開發,與中西目錄學廣闊而豐富的傳統似已呈現出相互割裂的狀況。這在一定程度上既影響了當代數字學術的進展,也使得目錄、索引等主流學術形式蒙塵,仿佛從此走向凋零。哈佛大學費正清中國研究中心的徐力恒兄閱畢拙文后,還檢討道,近些年“數字人文”工具的開發,似并未充分參照、總結目錄學的傳統和源流,從中獲得寶貴的經驗和啟示;圖書館學界與文獻學界、文史研究者各自為政,疏于交通,或系造成此一現況的重要原因。力恒兄參加過中國歷代人物傳記資料庫(CBDB)的建置工作,對文史數據庫的開發、利用情況相當熟悉,其高見應予重視;至于如何消除學科、專業壁壘,促進不同領域的交流、溝通,使不同學術成果之間交相輝映、啟迪,文獻學與“數字人文”深度融合,確屬目前及未來相當長一段時間內亟待解決的問題。
(三)作為研究工具的目錄之學
再次,自“上世紀九十年代以來,文獻學和實證主義史學影響下的現代文學研究雖已取得不俗成績,但仍有許多人認為,文獻學和一般的現代文學研究關系不大,而與古代文學、經學、歷史研究更為相關,或者說,一個合格的現代文學研究者,只要學會利用文獻史料及相關研究成果即可,并不必接受文獻學的訓練,當然,從事自己的研究也不必自文獻學開始。” 而一般研究歷史的學者,對目錄之學等中西傳統學問,似亦不覺其重要,因即便不習得、利用此類研究工具,照樣無礙于援筆作文、立論陳詞。但事實是否如此?
目錄和索引的核心,就是依照一定標準,將文獻資料進行排序、分類組織、整理。其產出的成果,也就是我們一般所謂的目錄、索引,為讀者查檢某一領域、主題的資料提供方便。但在同時,它也完全可作為一種研究工具被使用,不僅可以產出相應的研究成果,也構成了我們展開新的研究的基礎。因為專題目錄和索引,既可以有效地呈現出其所屬的一個小的領域、小的主題的結構與框架,也能使得其中一些研究不足的更小的領域、主題重新被照亮、被發現,從而有了引起研究者重新研究的可能,更重要的是,這一工作還有利于研究者系統、深入地汲取既有研究成果,避免了因資料豐富、不知分門別類而使自己的思考、研究陷入薄物細故不辨、牛溲馬勃并陳之窘境。
《〈新月〉目錄索引》
不過,為了討論的方便,這里仍不妨舉一個與《新月》雜志有關的資料(包含專書、報刊文獻等等)編目的例子。但首先必須聲明的是,這個目錄只是我自己一時所擬,只是一方便法門,實際情形一定要較此復雜得多,當然也需要被不斷地進行完善、修改:
在實際使用過程中,我們還可以為這個目錄的每一方面添加研究資料的重要信息,甚且借助Zotero等軟件實現編目需要(類似的軟件可以同時將我們研究資料的電子版,導入這一目錄,以便參閱、引用),幫助我們建立對這一研究領域及其所屬子領域的基本判斷。待其初步建成之時,我們不僅應能對《新月》研究的進程、現況了然于胸,而且將會對此一領域的研究前景有所洞察,更重要的是,它能夠幫助我們對自己的研究作一清晰、準確的定位,亦即個人的研究將在什么方面作出何種貢獻,還有什么問題、薄弱環節仍待補足,諸如此類問題也都將會有相當的自覺。
也因此,按照羅伯特·達恩頓襲自狄德羅的觀察,這種乍看似“目錄”、分類整理知識的框架的建立,實際上無異于培植下一棵有機的、“記敘‘人類知識的秩序與連貫’”、枝繁葉茂的“知識樹”。對于任一專業研究者而言,勢必都要經年累月、持續追蹤一個或幾個研究領域的進展,但如果其研究工作由目錄之學開始,由“知識樹”的培植開始,隨著新的研究成果和資料的不斷加入,這個“知識樹”也將不斷成長,從而呈現出知識的系統性、專業性與重要性;細致、耐心地觀察同一個樹枝下不同果實的差異,或者,對同一個果實,利用新的研究工具,轉換觀察、詮釋的視點,也一定會激發學者新的思考,帶來新的發現 。
對于研究《新月》雜志、“新月派”而言,這一“知識樹”必將發揮巨大的作用。學者若能在研究的過程中,可以時時返顧、澆灌此一“知識樹”,其《新月》及相關研究的整體格局、問題意識勢必不以個案的討論、史實的考證、單一文本的解讀而削弱,相反,盡可以小大由之,使細節、個案在與整體的無盡對話中,提出并完成一個又一個的研究甚至新的理論論述,從而切實推動這一領域的深入。
文學研究之外的例子也在所多見。如所周知,近代史學“二陳”(陳寅恪、陳垣)凡所研究,幾乎都從編定資料目錄、索引開始,尤其陳垣更是如此。所作《文津閣本元六十家文集目錄》《中國佛教史籍概況》《明末清初教士譯著現存書目》《四庫全書書目考異》《四庫全書撰人目錄》諸書,今人或不免視之為研究“副產品”,實多為其從事元史、佛教史、近代中西文化交通史等等研究工作之前,所作另一準備工作,它們本身也自有作為著述的獨特價值。
至此,可以肯定地說,在學術研究中,若能重視研究資料的排序、分類組織整理,“觀察所得需要加以篩選” ,積極編制專題目錄和索引,將會給我們的研究工作帶來很多幫助,直接推動學術研究的深入。這也就是我所理解的目錄之學作為研究工具、“致用之學”的意義。
(四)超越“檢索” 走向“閱讀”
最后,依我個人有限的經驗,閱讀紙質圖書(包括紙質的專題目錄、索引)與專門查檢資料而后狼吞虎咽、羅織為文,似仍為二途。更準確地說,由于學術專業化程度的不斷加深、國際高等教育市場與大學體系的激烈競爭,制度性的學術生產且“根據研究的問題進行檢索,以問題的探索為導向進行閱讀”漸已成為主流,但“按照目錄的方式,將某一主題的文獻逐一閱讀”仍然十分重要。
1926年上海掃葉山房版《書目答問》
陳寅恪、呂思勉、嚴耕望、羅爾綱等杰出的近代學人,亦曾不約而同地分別此二者,強調讀書而非查檢資料,方為治學之正途。但“讀書宜有門徑”,以故近人張之洞教導門生弟子,須拜《四庫全書總目提要》此一目錄學著作為師:“泛濫無歸,終身無得。得門而入,事半功倍。或經,或史,或詞章,或經濟,或天算地輿,經治何經?史治何史?經濟是何條?因類以求,各有專注。至于經注,孰為師授之古學?孰為無本之俗學?史傳孰為有法?孰為失體?孰為詳密?孰為疏舛?詞章孰為正宗?孰為旁門?尤宜抉擇分析,方不致誤用聰明。此事宜有師承。然師豈易得?書即師也。今為諸生指一良師,將《四庫全書總目提要》一過,即略知學術門徑矣。”不僅如此,張氏還撰有《輶軒語》《書目答問》等,金針度人。
也就是說,對于許多杰出的學者而言,目錄、索引、提要、敘錄等等,并非工具之書,而只有偶一查檢之用,反之,恰是通讀、研讀的對象。以近現代文史研究為例,由于時間、精力及其他條件有限,我們終其一生,都無法通讀(也許也并無必要通讀)全部的近現代報刊、作家學者文集和全集,但至少可以做到通讀諸多期刊、報紙的目錄和索引(假如有的話),循此再進入原刊、原典的閱讀與思考,必將事半功倍。另一方面,如果能在選擇性地閱讀原刊、原典之后,再將有關的目錄和索引通讀一過,則我們收獲了感受、印象、資料、線索的同時,也不致失去整體觀,從而避免了“碎片化”“撿到籃里都是菜”甚或入寶山而空手回的情況。在此意義上,不僅清人王鳴盛所謂的:“目錄之學,學中第一緊要事,必從此問途,方能得其門而入,然此事非苦學精究,質之良師,未易明也 。” “凡讀書最切要者目錄之學,目錄明方可讀書,不明終是亂讀。”數語仍適用,且《〈新月〉目錄索引》等近現代文獻的目錄、索引,亦不因數據庫中有其目錄甚至全文檢索功能而黯然失色,反之,仍待有心人反復打磨、完善,推出一個定本,供讀者閱讀、參考。
1931年南京國學圖書館版《書目答問補正》
至于拙文所謂目錄學喪失的實用性、當代性,當然也應該加一必要的限定,此即其主要針對著那些完全依賴互聯網、數據庫做其所謂“學問”的學者(互聯網民族志學者等或是例外)。我們不應該忽視的是,還有很多學人,仍切盼著一個時常可以關閉電腦、遠離網絡的世界,無數個可以潛心研讀、圈點、勾畫、校閱,與書籍及作者思接千載、心游萬仞的時刻,而非深陷于“論文機器”“學院動物”狀態不能自拔。這種閱讀、思考的狀態,有時呈現為“按照目錄的方式,將某一主題的文獻逐一閱讀”,有時則純粹代表了第三種閱讀方式——漫無目的的閱讀(desultory reading),而后者的存在,在在提醒我們,不妨享受“非職業閱讀”、沉思、奇思妙想的樂趣。按照亞里士多德、培根、夏目漱石、魯迅等人的理論,學術研究也好,藝文創作也罷,本來就是閑暇、余裕的結果,而閑暇“是一種精神的現象”“一種靈魂的狀態”“強調一種內在的無所憂慮,一種平靜,一種沉默,一種順其自然的無為狀態”今天,“硬寫”“硬譯”“硬評”如火得風而炎熾,幾有遮天蔽日之勢,但在我看來,有志的學者仍不能輕易向此流俗繳械投降,降低自己閱讀、思考、研究和寫作的難度。
(五)朝向新的目錄之學
一言以蔽之,除非人類的全部書刊資料都已經被充分的電子化、數字化,且可長期、有效存儲,開放給讀者訪問、使用,否則,目錄學的重要性容或下降,但其意義、價值,絕不可能被取消而致淪亡。從中西學術傳統來看,自其發端至今,目錄學的意義、價值,都和我們閱讀、研究的實際需要——查找、利用文獻資料——聯系在一起。因為無論是作為二次文獻的主流形式,還是知識管理、知識工程的重要內容,目錄、索引不僅與此一實際需求密切相關,也構成了我們走向文獻、獲得知識的必經之路(盡管現時代的途徑已更加多元)。這一實際需要同時決定了圖書館、資料室等機構的核心功能,即在于存藏文獻資料。換句話說,在任何時代、境況中,圖書館、資料室的發展皆須將此一需求置于優先地位,而非其他。更何況,我們即便擁有海量的數據庫,它也并不是萬能的,它的問題之多,絕不亞于紙質文獻史料。
在當下,無論在中國內地,還是全世界的其他國家和地區,圖書館等搜集、整理、收藏文獻資料以供人閱覽、參考之館所,朝向電子化、數字化、“智能化”的大勢,已然浩浩湯湯、一望無涯。置身于此一新的時代潮流之中,或許更有必要強調的是,包括圖書館在線“機讀目錄”或藉由搜索引擎和數據庫自動生成的檢索目錄(甚至個性化的目錄定制推送服務)等等新的知識管理成就,乃至其他五花八門的知識工程、服務等等的發展,并不應該以摒棄、弱化存藏文獻資料此一核心功能作為代價。如果我們無視這一讀者的實際功能/需求,昧于中西目錄學及文獻學傳統的守正創新,而完全依賴于信息技術的革命,甚或認為透過“人工智能”等新技術和“大數據”分析,即可拯救世界、包打天下、解決文明遺產保護和傳承的所有問題,或恐不免舍本逐末、自毀長城之虞。
對于目錄之學來說,今天更應該在近代學者奠定的良好基礎之上追求更大的發展,而不只是停留在目錄學史研究這一方面止步不前。近人余嘉錫嘗言: “吾國學術,素乏系統,且不注意于工具之述作,各家類然,而以目錄為尤甚。故自來有目錄之學,有目錄之書,而無治目錄學之書。”但自其講論目錄學至今,中國目錄之學的輪廓已大致建立,近代意義上的目錄學研究成果極為豐碩,可以說,我們所有人都受惠于這一學術遺產。也因此,盡管目錄學在今天面臨著重重挑戰和危機,但重溫前人這些拓荒性、奠基性的論述,竊以為,我們同樣也應該有勇氣、有責任,從危機、挑戰中為其尋找意義,創造新的發展方向和可能。就此而言,無論是對“數字目錄學”等新目錄學的理論建構,還是在實操中改進現有的各式編目與檢索系統,探索“數字人文”時代的書目控制之道,乃至對近現代目錄學進行全面、深入之勘探,皆屬新一代學者責無旁貸的使命。