試析“歷史化”視野中的電子史料問題
內容提要:當代文學的“歷史化”需要依托史料的收集、整理與運用。“史料”的電子化帶來保存的方便與搜索的迅捷,但也帶來傳統史料學之外的新問題。對作家“歷史”的研究因電子化而受到沖擊,特別是人工智能與輔助寫作工具的出現,使作家創作史、閱讀史等研究難度增大。在讀者接受史研究上,受“算法”與“推送”的影響,平臺能精準預測與掌握讀者反應,讀者則通過付費、審查等反饋機制,限制了作家創新。此外,在數據庫建設中,還未出現新的學術思維,規范化論文寫作也給人工智能的介入留下空間。這些現象都將對當代學科的“歷史化”提出新挑戰。
關鍵詞:歷史化 電子史料 讀者接受 數據庫
當代文學的“歷史化”不僅涉及到學科建制,作家作品“重評”,同時也是深刻反省自身觀念與知識,標志學科走向成熟的主要標志和必然環節。“歷史化”與史料的收集、整理、辨析有著緊密聯系。學者們注意到“史料”對當代文學影響,陸續涌現出許多研究成果。而電子史料是一個關注較少,討論也較少的一個問題。
對于“電子史料”,有學者認為是:“電子化史料,是指以數碼方式將圖、文、聲、像等多方位多媒體信息存儲在磁光電介質上,通過計算機等設備閱讀使用,用以表達思想、普及知識和積累文化的史料,它是史料現代化的基礎。”1在《電子化文學史料的內在形態與知識譜系》一文中,研究者初步總結了“電子化史料”的對象、特性與對文學研究的影響。按其定義,“電子化史料”實際上只是反映了“史料”儲備與閱讀方式的介質發生了變化,即由紙質轉變為電子設備。有學者指出應注意“電子化史料”和“史料的電子化”2,即不僅要注意到介質的變化,同時也要注意到由于史料電子化后產生的新史料。而近年來隨著科技的發展,許多“電子史料”出現了新變化,更為深入地卷入到文學研究的方方面面。
對于正處“歷史化”與兼顧當下批評的當代文學來說,電子史料不僅有著傳統史料學在當代面臨的問題,如當代作家年譜如何書寫,作品版本變化,史料“真實”辨析,歷史觀的調整與史料觀的認知變化等,更為深入地,電子史料還在作家批評、讀者接受研究等方面產生了深遠的影響,在享受電子化、網絡化便利的同時,當代文學應批評注意電子史料通過新技術甚至有可能形成“反歷史化”傾向。在本文討論里,電子史料將是一個泛指,既是史料的電子化,同時也是電子化史料產生的新史料,試圖探討因由技術進步而給文學批評帶來的新影響,特別是那些傳統史料學之外的新問題。這些問題潛在影響著文學批評,是當代文學研究面臨的迫切問題。
一 作家“歷史”的消失
19 世紀以來,因為對個性創作的尊重,文學批評關注如作家的心理活動和人生經歷等個人“歷史”,以期對文本有深入的闡釋。后結構主義提出“作者已死”的概念,雖然沖擊了作家的“權威”,但作家研究依然是許多批評進入文本的切入點。中國當代文學批評吸收了相關的理論,既反對庸俗、機械的作家創作心理批評,也反對文本中心式的批評模式。正如丁帆在回憶編輯《茅盾全集》時曾說:“‘茅編室’遇到的最大一次危機則是人文社的《新文學史料》發表胡風回憶錄時將茅公在1928 年脫黨后,也就是寫完《蝕》三部曲和短篇集《野薔薇》后坐輪船去日本,在船上與胡風遭遇的情景描寫公布于眾了。”但丁帆認為:“其實,今天看來,那段在‘革命加戀愛’的史實當中,正是我們解讀茅盾許多作品的鑰匙,那‘混合物’的創作之所以能夠成為左翼文學的開山巨制,誰說不是和這豐富而具有時代特征的文化心理緊密相連呢?”3確實,倘若沒有胡風的回憶,茅盾《蝕》的創作動機與情節來源是如何,依然會是個“謎”,而得益于作家間的互證與“史料”挖掘,才使研究者能理解茅盾當時的創作心理,由此更好地深入文本內部。
在當代,作家因媒體的充分介入,一方面有大量的機會對自己的人生、思想與作品進行闡釋,使作家“歷史”研究出現新的學術增長點4,另一方面,也因“搜索”引擎強大,使作家生活經歷無所遁形,各種“披露”式的“爆料”將會越來越多,各種自傳、年譜或研究傳記可以輕易獲得并得以對照與印證。作家“歷史”的研究不再因信息的不對稱而產生遮蔽,從而給研究者提供了廣大的空間。
但是電腦創作開始后,也開始沖擊作家“歷史”研究。最直觀的體現就是手稿的消失。手稿作為研究作家構想、寫作、修改到定稿的重要證據,體現的不僅是作家創作的身體狀況、情感狀況、思想狀況、經濟狀況和社會交往狀況,其修改過程也能略窺其深層心理傾向。然而對于“80 后”“90 后”的作家來說,習慣于電腦創作之后,手稿的消失已然不可避免。倘若將這種改變僅看成是書寫工具的變化—晚清至“五四”,書寫工具就由毛筆向鋼筆等西方硬筆轉變,很難發現工具變化背后的沖擊。但從史料的角度來看,手稿的消失,不僅意味著一種介質的變化,直接沖擊了當代“史料”研究里的私人性文學史料模塊。后來的研究者將難以獲得其手稿的初樣,更難以獲得其修改的過程,也因此更難以窺及作家書寫時的心理狀態與心理變化。手稿的消失意味著作家創作史研究將面臨挑戰。
電腦寫作帶來的不僅是手稿的消失,更為深層的影響在于威脅到作家的寫作習慣。作家使用電腦寫作必須采用“輸入法”,而這種輸入習慣的改變將是深遠的。輸入法不管是五筆還是拼音,已不是早年那種呆板只能單個字輸入的方式。為了追求打字速度,輸入法近年來“進化”得越來越“智能”。如有些輸入法提供了兩種詞庫,一為基礎詞庫,即:“基礎詞庫包括:系統詞庫和用戶詞庫。系統詞庫是輸入法自帶的詞庫,為您的輸入提供基本的字詞。當您開啟學詞功能時,輸入法將記錄您所打過的字詞,這些記錄下來的字詞集合就構成了用戶詞庫。因此,用戶詞庫是個性化的。”5優秀的作家對語詞與句子結構都十分敏感,并且會不斷挑戰自己的寫作習慣與組詞規律。但“用戶詞庫”通過潛在的學習,將作家習慣用語甚至用句收集、整理,并在電腦輸入時直接跳出。它的存在產生了兩個效果,一是使作家“固化”自己的詞語運用。作家在創作時,看起來是不斷創新運用新詞語,但實際上是“智能學習”將自以為創新的字、詞、句不斷重復運用。再則,作家會強烈意識到必須在結構、人物形象、故事情節上的創新,然而詞、語組合的創新則因“個性化”輸入法,使作家無意識地不斷自我重復,這種危害更為深入而且隱蔽。除了基礎詞庫外,輸入法還有所謂的“細胞詞庫”,如以“美的修辭”詞庫為例,其樣例有“暗送秋波、暗香襲人、般般入畫、百般難描、薄粉敷面、白璧無暇、步履輕盈、半妝美人、閉月羞花、冰肌瑩徹、冰肌玉膚、滑膩似酥、細潤如脂、粉光若膩、鬢云亂灑、酥胸半掩、楚楚衣衫、豆蔻華年、春半桃花”。倘若作家安裝了這樣的詞庫,以“五筆”輸入法為例,隨手輸入“tttg”,詞庫就會出現“我行我素、自生自滅、般般入畫、片箋片玉、微香冬青”這樣的5個詞,看似方便了作家的選擇,甚至提供了一些偏僻的新鮮的詞語,但這種選擇背后卻將會是思維與表達的限制。作家若非時時刻刻警惕這些陳詞帶來的影響,否則將不可避免地落入到輸入法的圈套中,看似全新的創新式表達,實際上只是由于輸入法帶來的思維定勢。書寫工具以“智能學習”抹平了作家的創新沖動,使其陷入陳詞濫調之中卻絲毫無所察覺。而由于手稿的消失,我們將很難找到輸入法對作家產生影響的“實證”,但這種變化將提醒作家創作史研究,不僅要關注作家的語言特點,更應注意其輸入法的選擇,注意辨析其語言特殊性是由何種原因形成的。
如果說電腦寫作、輸入法僅是挑戰了部分作家研究,但近年來人工智能寫作的進入,則全面挑戰作家“歷史”研究的方方面面。所謂的人工智能寫作其實離文學并不遠,現在已被大量采用的“機器人記者”,它們能監視各路信息,完整呈現新聞的五要素,以更快的寫作速度,更及時的更新與發送速度將信息傳達給人們。對于這種“機器人記者”,研究者總是樂觀地指出人工智能寫作還不能寫出創新性、有文藝氣息的新聞,認為“未來記者和編輯將會被機器代替”只是一種聳人聽聞的說法。從目前“機器人記者”的創作來看,人類的個性化、文藝化的新聞寫作還是無法被它們模仿,但它們能實現兩點人類所無法企及的效果:第一,“迅速”,無論是信息的收集、整理還是寫作,其深度、廣度、速度都遠遠超過人類。第二,“大量”,它并非追求精品,而是在不斷學習中,以人類寫作平均水平之上的能力大量書寫新聞,實現傳播的全覆蓋。從這兩點上看,“機器人記者”完全有可能取代許多平庸的記者。
“機器人記者”因其市場運用較廣,得到各類資金支持,開發較為完善。在文學創作領域,人工智能介入較多的是網絡小說創作。雖然還沒出現“機器人網絡小說家”,但有些軟件通過云服務和大數據的支持,號稱能通過全網的內容抓取,分析讀者受歡迎的開頭、結構、詞語、類型,提供給寫作者以創作“規律”并從字、詞、句到結構上進行全面“指導”。有些軟件號稱:“寫作的時候因為閱歷的問題,想到的場景容易平淡無奇,這個時候就想看看其他人到底是怎么寫的,聯想啟發工具正是基于這一需求而設計。當你想寫一個場景,一場打斗,一個劇情沒有什么頭緒的時候,就可以使用這個工具按照特定關鍵詞聯想一番,激發靈感,舉一反三。”并配備了一系列“套路化”的工具:如名字生成器、門派勢力生成器、地名生成器。通過這些工具,可以隨機生成模仿周禮中的謚號等名稱,使原本可能需要作者通過較長時間的人生經歷、閱讀積累才有可能形成的知識,變成隨手可得并富有“歷史”感的名字。可想而知,在這些軟件建議下形成的“網絡小說”看似可以形成龐雜的歷史空間,實際上從情節、對話、人物描述等均是由輔助創作而來。
許多網絡文學批評,常指責網絡類型小說沒有“真情實感”,出現大量的模仿、粗暴抄襲,然而卻沒有意識到“人工智能”進入網絡小說創作后,“情感”可以被精準調配,抄襲會被有意規避,但模仿卻更為普遍。這時,如果沒有人力的細致對比與辨析,網絡批評可能無法辨別小說到底是人工創作還是智能輔助下生成的產品。更為關鍵的是,人工智能寫作跟新聞寫作的目標是一樣的,并不試圖創作出頂級的小說,而是通過“迅速”寫作與大量模仿,搶占讀者市場。優秀的網絡小說將很難在其包圍下脫穎而出。而人工智能也會在“學習”中達到人類平均寫作水平之上,甚至有些表現非常搶眼。如2016 的人工智能所寫的《電腦寫小說的一天》就獲得了日本“星新一文學獎”。雖然它的獲獎是個案,但這也意味著作家批評必須轉向—網絡文學批評以后的首要任務可能是追問小說到底是人的創作抑或是機器人寫作?看起來很遙遠的人工智能,實際上已經降臨在“類型化”的通俗小說身上。作家的“歷史”也將變得十分可疑。網絡小說因其商業化程度較高,驅動了人工智能的相應開發。而人工智能對嚴肅文學的影響看來還有段距離。但有些寫作助手已經可以輕松地實現信息與數據處理上的秒級運算,能挖掘熱點,組織相關知識關聯,推薦相關內容,還能糾正錯誤表達,檢測重復率。非頂級的嚴肅作家們如果使用了這些人工智能,那他們的“歷史”將與文本創作徹底分離。
電子網絡時代的到來,使作家研究更為豐富,但也同時在不斷挑戰相關的研究范式。手稿的消失,使私人性的史料受到威脅,從“歷史化”的觀念來看,作家的部分“歷史”也消失了。而人工智能的深度卷入,瓦解的不僅是作家對文本擁有的“權威”解釋權,也瓦解了社會思潮、人生經歷對文本的重要性。文學批評必須重建研究作家的方法:既要注意到作家的生平、心態、“閱讀”習慣、思想來源和知識水平,同時也必須考察作家使用的輔助工具、人工智能,通過這兩方面的考察,才能更為深入地理解作家與文本之間的關系。電子史料開始展現其強大的“反歷史化”傾向。進一步,由于電子網絡時代的發表平臺使普通人也可以輕易地成為“作者”,也帶來一系列問題。數據顯示:“我國數字閱讀作者數量從2014 年的389 萬增長至2017 年的784 萬,四年翻了一番。作者數量的不斷增加為實現數字閱讀行業的內容共享奠定了基礎。”6如此龐大的寫作者,生產出同樣龐大的作品。文學批評應如何從中挑選出“經典”而“優秀”的作品?優秀的作品有可能被無數的平均水準的作品所淹沒,優秀的作家也許在剛起步就被無數平庸而帶智能輔助的作家所窒息。從網絡小說的實踐來看,作家要凸顯自己,只能以讀者的閱讀量來檢驗,但這也產生另一個疑問:網絡時代的讀者接受研究是否可靠?
二 可疑的讀者接受
在接受理論中,讀者是個核心概念,研究者提出諸如“虛構的讀者”“想象的讀者”“理想的讀者”等,通過對讀者的考察,也引出對作家創作的考察,提出如“隱含的讀者”概念,即作家會通過讀者的反應而將這些信息整合、篩選、融入到自己的創作里。姚斯在《作為向文學科學挑戰的文學史》一文里提出:“文學的歷史性和文學的交流特點, 是以作品、讀者和新的作品之間一種對話的、同時類似過程的關系為前提的, 這種關系既可以在講述和接收人的聯系中, 也可以在提問與回答、問題與答案的聯系中去把握。”7從他的觀點看來,讀者的閱讀反應,讀者接受的程度是評價文學作品價值的一個重要尺度,而文學史就是“讀者接受史”。
在接受理論的視野下,當代文學批評關注到了作家、文本之外的讀者,拓展出讀者來信等研究。在網絡時代到來后,許多原本在接受理論中,屬于猜測性的讀者反應、接受狀態變成可查證的“史料”。如接受理論的核心概念之一:期待視野8。在接受理論中,文學作品要實現順利的接受:“只有讀者的期待視野與文學文本相融合,才能談得上接受和理解。”9而讀者“期待視野”的形成受制于社會背景、人生經歷、生活實踐和文化修養等方面。在網絡創作里,可以清晰看到讀者期待視野對作品的影響。當作家在網絡上開始發表作品后,期待視野就以各種方式直接投射到作家身上。據報道:“2018年還誕生了網文歷史上第一部評論量超過一百萬的作品《大王饒命》,十萬以上評論量也已成為爆款作品的標配。”10讀者與作者在評論區里相遇,這在傳統文學里是不可想象的,除了書評區外,平臺還設置了“每段說”“可以實現文字彈幕效果”(即閱讀時可以隨時彈出其他讀者對其評價)。作者創作下一章節前,會收到讀者對情節、人物、結構的點評,有些讀者還喜歡以“退訂”的方式威脅作者的寫作方向。讀者擁有了更大的主動權,他們的“期待視野”可以通過付費機制和評論機制,直接反饋給作者,使作者明白其創作內容與接受程度,從而決定下一步寫什么內容,這樣雙方應該是實現了完美的“接受和理解”。
文學批評當然是不認可這種“融合”,批評者認為讀者日益淺薄而放棄嚴肅思考,或者指責作家迎合市場而放棄審美創新。但這些看法,其實都未抓住網絡時代給予文學的重擊:商業網站完全以市場原則,掌握、制定了創作與接受。表面上看,作者可以自由寫作,讀者可以自由批評,但背后都必須遵循著市場原則,特別是在大數據興起后,網站已完全有能力將讀者視野限制在其可預測的范圍內,進而通過付費機制影響作者。如有小說發表網站就推出“智能訂閱”功能:“我們從更利于大家‘感知’‘互動’以及滿足需求‘多樣性’三方面出發,全面革新了核心算法排序,采用‘神經網絡’‘NLP自然語言處理’‘機器學習排序’等多項最新技術,來推薦更符合大家口味的書,從而解決你的書荒問題。”11 網站以專業術語隔絕讀者對其深入思考,用它的話說是:“你只要進入為你量身定做的專屬智能推薦頁,就可以看到最新的算法技術為你推薦的好書。”也就是說,讀者不用追究為什么會推送這些東西,只要想“書”是不是合意就可以,那么,這個“算法”是基于什么?從目前我所使用的幾個APP 看來,特別是跟購物網站相關聯的公司所開發的讀書APP 來看,它不僅基于讀者點開、試看了哪些書或者長期保存、閱讀的書目,還基于讀者在購物時的特點、興趣與愛好,甚至讀者通過網絡購買實體書的相關信息也會被收集,然后反饋到“算法”里,將其相似的內容準確地推送到讀者面前。這些推送的“書”不僅有網絡小說,也有嚴肅文學,甚至有哲學類的偏僻少見的著作。倘若讀者沒有注意—一般讀者也不會注意—他們只會發現自己喜歡的內容被不斷推送。讀者的閱讀范圍其實被“推送”所嚴格限制。在“算法”的無邊籠罩下,讀者只能看到網站所給予的信息,而不是獨立自主的選擇權。
智能的“推送”限制了讀者視野,而市場也由此挑選作者。按數據顯示:“2018 年,閱文在線閱讀月度活躍用戶突破2.14 億戶。”這些讀者里年輕讀者大量增加,迅速傳達到作者身上:“年輕讀者去中心化的、多元化的內容需求傳導至作家創作,迅速孵化出二次元、現實主義、科幻等新的流行題材。”網站根據讀者的需要,迅速調整作者:“據統計,閱文集團2018 年新增作家群體中,‘90 后’作家占比73%,‘95 后’作家占比48%,優秀年輕作者不斷涌現。”當文學批評還在討論“70 后”“80 后”及“90 后”的時候,網絡小說世界里已然呈現世代更替。網絡小說已然出現“傳統網文”概念,作者稍不注意就被讀者所拋棄。“隱含的讀者”并不是一個虛假的概念,而是實實在在地以“算法”約束下,對作者創作方向提出要求的現實影響。從這個意義上講,當下的網絡文學雖然發展迅速、普及面廣,但其實從作者、讀者到流通完全被市場所籠罩,加上“算法”橫行,很難期待其可能在文學創新上有突破。
網絡文學的批評者樂觀地指出“類型套路”是一種“集群體智慧的文學發明”12。然而,網站平臺的選擇服從的不是作家創新套路,也不是讀者要求,而是商業化原則,這也造成對“類型套路”的巨大壓抑。2019 年5 月,起點中文發布公告:“因站內作品違反《網絡安全法》《互聯網信息服務管理辦法》等相關法律法規,為嚴格落實監管部門要求,自2019 年5 月21 日15:00 起至2019 年5 月28 日15:00 止,起點中文網‘異術超能’、起點女生網‘N 次元’欄目暫停更新七天,進行全面徹底的自查整改。”13與之配套除了封禁作者,還推出相應的舉報功能:“第四:完善舉報機制,鼓勵用戶通過網站7×24 小時舉報平臺和一鍵舉報功能積極舉報違規作品,并將招募資深用戶進入網站巡查系統,共同參與內容日常巡查工作。”讀者不僅是一個接受個體,搖身一變成一個具有審查功能的主體,其對網絡文學的沖擊是不言而喻的,從中也可以看出“類型套路”背后被規定的因素。據不完全統計,5 月的這次整改,使玄幻類小說銳減35萬本,都市類少了21萬本,其他類型各受沖擊,如科幻類少了8萬本,奇幻類少了8萬本,游戲類少了7萬本,女生網少了7萬本,二次元少了7萬本,歷史類少了5萬本。當然,監管部門出于保護知識產權,同時也是維護社會主義價值觀而整頓網絡文學,有利于網絡文學的長期發展,但市場以更為苛刻的審查制度窄化了作者發表空間與創新沖動,而讀者審查機制的確立,也嚴重地沖擊網絡文學的創新。
嚴肅文學創作看來還可以逃脫掉市場的收編,還可以依靠著期刊、批評而爭取到一部分的讀者。那些成名于1980 年代、1990年代的作家依然在讀者中、市場上、批評圈獲得大量的關注。網絡文學現在遭遇的讀者困境看起來還離嚴肅文學很遠。嚴肅文學依然可以逃開網絡酷評,作家依然可以挑戰讀者習慣,可以反抗商業的收編。但試想一下,以電子閱讀為主的“90 后”讀者成為文學閱讀的接受主體,他們熟悉于“推送”與“去中心化”,習慣于以個人愛好貶斥作者創新時,嚴肅文學是不是還經得起這樣的挑戰?嚴肅文學依然可以保有對陳規的蔑視,依然可以守住學院式批評的空間,但讀者群體將會越來越少,讀者接受史還如何往下寫?
三 文學批評所可能出現的新問題
在作家、讀者的“歷史”均受到沖擊時,文學批評也受到電子史料的影響。陳平原在2012 年談到“數字人文”的變化時就指出:“現在求知這個層面被檢索所取代,只要知道一個書名和人名,檢索就行了;而閱讀的功能更強調了娛樂功能。原來苦苦追尋、上下求索的狀態消失之后,知識有了,但修養沒有了。”14電子檢索、史料網絡共享在文獻收集、前人研究整理及避免重復勞動上對研究者有很大的幫助。從現在大量博、碩士論文里,可以清晰地辨別出“搜索”式的論文,文學批評自然也受其影響,出現對上下文語境考察的缺失,原始資料的忽視,以搜索代替問題等現象,有關“搜索”帶來的影響近年來已引起學界的重視。
電子史料對文學批評的另一個重要影響是極度“豐富”了文學的“周邊”。正如程光煒指出的:“除研究當代文學的審美性之外,還應該去研究它復雜且因為社會思潮經常性膨脹和冷縮而不確定的周邊。沒有周邊的當代文學研究不能說是更完整和更真實的當代文學研究,至少是缺少歷史觀的當代文學研究。”“這種對周邊的注意,這種有意識把周邊當作文學史研究的更寬幅的歷史視野,作為一種方法和眼光,我們也許能夠更有效地進入整個當代文學研究之中。”15這里的“周邊”指的是非文學的其他因素,電子化為當代文學批評提供了便利的條件去考察“周邊”。除了電子化的期刊帶來的便利外,近年來,當代文學批評日益重視媒介研究,這也因“史料”電子化的結果。如研究革命現代京劇,雖然有些劇團還保留著片斷演出,但實際上演出場次很少,也不全面,更不用說演員在體型、風格上的不足。通過影視史料,確切地說當VCD 大量普及后,研究者才能再次目睹當時演出的效果,這些戲劇“史料”的電子化,使研究者能較容易地獲取并得以反復觀看、研究。1980 年代許多文學作品被改編成影視作品,如果沒有電子化這些影視作品,特別是通過在網絡保存下的這些作品,那么1980、1990 年代的影視媒介與文學的融合研究將難以展開。當然,這類“周邊”性質的“史料”電子化后,一樣存在著過于瑣碎、離文學性太遠、不斷重復等問題。但這是研究視角與研究方法的問題,而不是由于電子化史料而產生的問題。影視作品改編、作家訪談影像這些資料,對于當代文學批評有著重要作用,這些資料的收集、整理,對未來“歷史化”有著很重要的作用。
新科技手段被運用于重新整理“史料”也促使文學批評出現新方法。以國家社科基金項目為例,自2004 年《中國古代詩歌聲律數據庫的建立及中近古時期詩歌》獲立項后,陸續有數據庫建設的立項題目。如2011年的《網絡文學文獻數據庫建設》,2015 年的《中國現代文學報刊作品系年及數據庫建設》及 2017 年的《“學衡派”年譜長編及文獻數據庫建設研究》均是試圖推動史料的“電子化”。2018 年,在中國文學大科目下,直接以“數據庫”建設為題目的基金項目多達5 項,與中國現當代文學有關的有3項,特別是《中國當代文學期刊目錄分類編纂及數據庫建設》與《寧夏當代作家數據庫建設與研究》更是預示著當代文學在史料電子化上的步步推進。除了數據庫,基于文學地理學的研究也陸續出現,隨著GIS(地理信息系統)的成熟,有學者將其運用到文學研究上,如學者嘗試對當代陜西文學進行地理考察與研究16,雖然還未能獲得更多的討論,但研究思路與方法是值得注意的。
但數據庫這種史料整理方式還未能引起批評者的警惕,參與數據庫討論的學者主要集中于圖書館學、情報學,基本沒有文學批評者的參與。從現存的文學數據庫使用情況來看,文學數據庫建設者僅將其當成是“史料”存放的便捷方式,而不是一種新的思維方式17。古代文學的數據開發,已有一些成果引起關注。如北京大學中文系李鐸主持的“全唐詩分析系統”“全宋詩分析系統”;中南民族大學王兆鵬教授主持開發的“唐宋文學編年地圖”。“全唐詩分析系統”除了檢索方便外,還具有“詩提取、格律詩標注、字及詞組的頻率分布統計、用戶自作詩的格律分析等帶有智能化特點。”18換言之,用戶可以利用這個數據庫全面統計全唐詩,挖掘其中的關聯與相似性,進而生發出新的學術觀點。然而對于現當代文學的數據庫,從數據庫建設、架構與設置來看,未曾有人深入討論,更未有設想其可能產生的學術新問題。
數據庫是電子化史料的集中體現,它通過不同地域、不同領域的數據共享,形成超越地域的共同體性的“史料”,其核心精神是“共享”。但從目前所開發的情況來看,“共享”遠未形成。數據庫的建設需要花費大量資金,因此建成以后往往是付費使用,而使用的價錢不是個體研究者所能負擔。如某網站推出的紅色歷史文獻庫,據介紹:“紅色歷史文獻庫分為紅色大報、紅色名刊、紅色著作和紅色紀實四編,收錄自1915 年新文化運動至1949 年全國解放期間,中國共產黨及外圍組織公開和秘密出版的各類報紙、雜志,中國共產黨領導人、共產黨員以及黨外、國外友好人士公開發表的各類著作、記實文章,總計300 種。各據初印原件或權威復印件,采用獨有之數字化技術制作,三窗點選式頁面,影像和錄文逐頁對照,全景和區位自由切換。毫秒級全文檢索,配備多功能研讀平臺。堪稱紅色征程的全記錄,黨史研究的好助手。”但按其最便宜的年費版,為1.6萬元/年,而所謂的本地版與典藏版,則為16 萬元。本應是基本的研究資料,因公司參與開發,成為必須付費的數據庫。在該網站上,較便宜的數據庫為《申報》數據庫個人版:“1.月卡50元,年卡500元,在卡限內可任意檢索和瀏覽。2. 如下載數據則需另外購買下載卡,100 字/0.1 元。”雖然方便了研究、檢索,但倘若使用資料較多,也是一個巨大的負擔。此外,數據庫建設有時還成為圖書館不愿意“共享”的一個借口。許多圖書館出于珍藏的“史料”保存不易與避免對資料的損害,通過掃描建設相關數據庫,從好的方面來講,讀者可以借由電子設備接觸“原刊”,但從目前情況來看,存在兩個違反“共享”的問題:1. 圖書館并不愿意將電子史料在網絡上“共享”,讀者還是需要到圖書館查閱,并且看不到原刊。2. 圖書館因經費的限制,對于資料的電子化進度推進速度不一。特別是由于對資料的“珍貴”程度判斷不一,許多資料一旦進入電子化后,因經費問題常被擱置,這就形成這些資料既不能查閱原刊,也無法從電子路途窺及,讀者反而無從接觸。
數據庫建設的推進,還會引發數據間冗余與混亂。所謂的數據庫冗余指數據之間的重復情況。從目前建設成的《四庫全書》數據庫建設情況來看,因其依托古典文學的清晰分類,較好地解決了數據庫內部數據冗余問題。但現當代文學的數據庫建設則未見提出鮮明設想,如何分類以解決冗余,至今未曾見數據庫建設者提出相應的看法。也許這種架構在他們看來是理工科的問題,但關鍵的是分類必須基于研究者對“史料”的判斷,基于“史料”內部的聯系,可以注意到文科的分類方法與理工科的分類存在著巨大差異。數據庫的建設者不應簡單地認為這些問題是技術問題,而讓位給理工科思維的建設架構。而數據庫間也存在著冗余現象,從《中國當代文學期刊目錄分類編纂及數據庫建設》與《寧夏當代作家數據庫建設與研究》這兩個題目就可以預見內容上會產生冗余。這也應引起學界的警惕。
電子化史料還有另一個值得警惕的是論文發表平臺電子化后帶來的問題。當代學術型研究論文普遍被收入知網,而知網也形成相應的學術規范,從學術發展看,這樣的變化是積極的,但也引起許多爭議,特別是期刊雜志以引用率為評價的方法,已使學者注意到其中問題。而有可能引發另一個問題的是由于學術規范帶來的論文行文方式的僵化,從而給人工智能的介入提供了機會。2005 年,美國麻省理工學院計算機科學與人工智能實驗室的三位研究生開發了論文寫作軟件SCIgen,它能夠自動生成無意義的英文計算機科學研究論文,并且包含圖片、表格、流程圖和參考文獻等。2007 年,伊朗沙里夫科技大學學生使用SCIgen 生成的論文《Cooperative, CompactAlgorithms for Randomized Algorithms》被《應用數學與計算》雜志所錄用。德國的學生Herbert Schlangemann 還利用這個軟件,虛擬出Schlangemann 教授,用SCIgen 生成的《Towards the Simulation of E-Commerce》通過了同行評審,被CSSE 錄用。同樣,他還以Schlangemann 教授之名投稿了2008 年和2009 年在中國武漢舉辦的兩個IEEE 國際會議,并被邀請出席。而這個人工智能論文系統還能為學者刷引用率。外國學者曾嘗試用SCIgen生成了102篇垃圾論文,使一個虛擬名字為IKE ANTKARE 在谷歌學術中的h指數,一下子飆升到94。可能因為文學領域的人工智能開發并沒有那么大的經濟價值,也可能因為文學批評還無法模仿,目前中國的文學批評還未被人工智能寫作機器人“盯上”。但從目前經常被報道的抄襲現象來看,倘若真有人工智能的“好事者”基于“知網”進行論文寫作開發,文學批評是否能逃脫?未來似乎并不樂觀。
電子史料帶來了便利,也帶來挑戰,對于當代文學研究來說,電子史料不可避免地參與到歷史化的進程中,而且隨著技術的進步,這個影響過程將呈現加速狀態。從國家基金項目到網絡文學的變化,都證明了它對學科建設、作家創作、文學批評等方面有巨大影響,也因此必須加以認真關注。
注釋:
1吳秀明、李一帥:《電子化文學史料的內在形態與知識譜系》,《福建論壇》2016 年第1 期。2張廣海:《建構中國當代文學史料學的路徑和方法芻議》,《創作與評論》2017 年第16 期。3丁帆:《我走過的四十年的文學道路》(上),《文藝爭鳴》2019 年第1 期。
4如探討作家如何在閱讀中生成小說,郭洪雷:《畢飛宇小說創作論——以其閱讀經驗為副線的考察》,《中國文學批評》2018 年第3 期。
5 https://pinyin.sogou.com/dict/.
6 http://top.askci.com/news/20180925/1737451132806.shtml.
7中國藝術研究院馬克思主義文藝理論研究所外國文藝理論研究資料叢書編委會編:《讀者反應批評》,文化藝術出版社1989 年版,第142 頁。
8 9姚斯定義“期待視野”為:“對文學的期待、記憶和預設所組成的、生發意義的視野之總和。”[ 德]H.R. 姚斯:《文學史作為向文學理論的挑戰》,《接受美學與接受理論》,周寧、金元浦譯,遼寧人民出版社1987 年版,第30—35 頁。
10以上數據均引自《閱文發布2018 年全年財報》,http://view.inews.qq.com/a/TEC2019031800760700?openid=o04IBAJUlI8LOPPAFP_ZkQl0I6XQ&key=&version=17000329&devicetype=iOS12.1.4&wuid=oDdoCt1BRH5WApdMSYQOL-IRPxfg&sharer=o04IBAJUlI8LOPPAFP_ZkQl0I6XQ&uid=&shareto=.
11《因為更懂你,我們做了這件事》,https://mp.weixin.qq.com/s?__biz=MzAxMzM1MzU5OQ==&mid=2651113663&idx=1&sn=98bf753bbbbfbfa4fc40828472c4f921&chksm=8053bfafb72436b92ce48bf0c1497b4c7e238b23a3e0617a64f19eff898567a13167e2dedde7&token=881465427&lang=zh_CN#rd.
12 邵燕君:《網絡文學的“斷代史”與“傳統網文”的經典化》,《中國現代文學研究叢刊》2019年第2 期。
13 https://www.qidian.com/news/detail/422817457
14 吳越:《當閱讀被檢索取代,修養是最大的輸家——陳平原談數字時代的人文困境》,《文匯報》2012 年7 月13 日。
15 程光煒:《文學史二十講》,東方出版中心2016 年版,第2—4 頁。
16 梁璐:《陜西文學地理分異研究》,《地理科學》2008 年第1期。
17據報道“網絡文學文獻數據庫建設”國家項目已結項,成果為4 部書稿:《網絡文學編年史》《網絡文學研究成果集成》《網絡文學詞典》和《網絡文學生成譜系》,約170 多萬字。網絡文學文獻數據庫于2014 年在“中國網絡文學研究網”上線運行,但現已查找不到。
18 http://www.chinabooktrading.com/tang/.
[作者單位:福建師范大學文學院]