GPT時代的創意寫作
AI幫我擊敗莫言?
最開始的時候,排名第一的是莫言發表在《十月》雜志上的小說《等待摩西》??傻搅俗詈笠惶?,《小說界》選送了我與AI共同創作的《出神狀態》。結果在AI評委的眼中,這篇小說以0.0001分的優勢反超登頂。就這樣,我成了“打敗”莫言的男人。
2017年,我與前Google同事工程師王詠剛一起開始一場寫作實驗,用CNN(Convolutional Neural Networks,卷積神經網絡)與LSTM(Long Short-Term Memory Network,即長短期記憶網絡)訓練能夠模仿人類創意寫作的算法模型。機器寫作并不是新鮮事,早在上世紀90年代,自動化程序便能以拼貼組合的統計學方式寫詩,抓取實時資訊生成結構性新聞等等,但是作為高度復雜的敘事文本——小說所要求的邏輯性、自然語言理解能力,以及對于人物、情節、結構、文法的不同層面的要求,之前的AI尚未達到這樣的能力。
我們用CNN對小說文本進行特征提取,然后將輸出的特征圖譜(feature map)映射為序列矢量輸入到LSTM網絡,便可訓練出能夠模仿人類寫作的算法模型,然后通過調整參數,也就是所謂的fine tuning,讓它寫出來的東西盡量接近我們現有對于文學的理解和審美。學習了上百萬字我的作品之后,AI程序“陳楸帆2.0”可以通過輸入關鍵詞和主語,來自動生成每次大約幾十到一百字以內的段落,我與它共同創作的作品《出神狀態》,甚至還贏得了一座由AI評委評出的獎杯。
最開始的時候,排名第一的是莫言發表在《十月》雜志上的小說《等待摩西》。大家覺得算法挺靠譜,諾獎得主得獎,那還能有錯?可到了最后一天,《小說界》選送了我與AI共同創作的《出神狀態》?!冻錾駹顟B》的靈感來源是智利作家羅貝托·波拉尼奧的短篇小說集《地球上最后的夜晚》,故事記錄了主人公去上海圖書館還書途中的見聞思想,深入探究通訊中斷與緊急狀態下的人與社會。結果在AI評委的眼中,這篇小說以0.0001分的優勢反超登頂。就這樣,我成了“打敗”莫言的男人。這次比科幻還要更科幻的驚喜也讓我醒覺到,未來的機器將更深入地卷入人類創作中,未來的內容版圖也會變得更加復雜、曖昧而有趣。
巧合的是,2017年也正是Google發布重注意力機制與Transformer算法,并開啟了機器學習在自然語言處理(NLP, Natural Language Process)領域狂飆突進的歷史性時刻。之后,我們見證了OpenAI推出的GPT(Generative Pre-Trained Transformer)模型不斷進化,挑戰人類對于智能、意識以及創造力的理解邊界。
如何實現人機共舞
未來的作品,讀者或許根本分辨不出到底哪部分是人寫的、哪部分是AI寫的,因為這里包括非常多不同層次的修改和潤色。AI提供給我們非常強大的工具,創意的工具、寫作的工具、設計的工具,同時也讓我們思考到底原創性的邊界在哪里,人類的主觀能動性在哪里,包括知識產權,包括怎么尊重被采集數據的作者,他們是否也擁有一定的權利。
2022年11月30日,在我的生日這天,OpenAI推出基于GPT-3.5的ChatGPT——一個能夠回答問題、寫作小說、論文甚至代碼生成的對話式AI,在全球掀起現象級熱潮。它從0到獲得100萬用戶只用了不到5天,而Twitter用了兩年,Facebook用了300天,Instagram用了75天。相比于之前的GPT-3模型,ChatGPT增加了“依據人類反饋進行強化學習”(RLHF, Reinforcement Learning with Human Feedback)的概念,能夠更好地理解文本更深層次的復雜含義,無論是連續流暢的對話,還是對于錯誤想法的糾正,甚至能夠質疑不合理前提或者干脆拒絕惡意提問,足以讓對話者產生“以假亂真”的幻覺。
如果說2017年的“陳楸帆2.0”語言模型還是混沌不堪的“隨機鸚鵡”,簡單的人稱都搞不清楚,人物關系里面誰是誰、彼此的聯系是什么,寫著寫著它就搞混或者顛倒了。但到了GPT-3.5和ChatGPT,它的寫作能力已經超乎想象。在一個序列里,你給它一個環境或背景去做續寫,你能看到它前后的連貫性保持得非常好,甚至還能給出一些你意想不到的轉折,有一些甚至令我覺得帶有更深層的文學意味。
現在我花非常多的時間探索怎么跟ChatGPT合作,這肯定不是我們原來想象的簡單粗暴的“復制粘貼”的過程,它是一個非常復雜的人跟機器共生的、共同寫作的過程。在這個過程中我會對自己的寫作有非常多的反思,它讓你理解到你作為人類的邊界、慣性在哪里。
我會用它來進行頭腦風暴,或者生成一些對某個陌生場景非常細致的描寫,甚至把一段話輸入進去,讓它調節整體風格,變得詼諧一點,或者嚴肅一點,也可以模仿某個作家的寫作風格。幾秒鐘之內,AI就可以給你生成一段接近你要求的內容。但這是一個反復迭代的寫作過程,它跟我們傳統的、人文主義的寫作是完全不一樣的,我覺得這非常有意思,它會在可見的未來改變很多領域,寫作也會是其中之一。
最近我正在寫一個兒童科幻小說,寫一個非常懂AI的城市女孩去一個原始村落,遇到另一個少數民族女孩的故事。我會讓ChatGPT幫我描繪一下未來的AI城市是什么樣的,這個女孩一天的生活場景是怎么樣的,它寫出來的非常像《小靈通漫游未來》,我把文本再回輸進去,要求它再增加一點文學性,再增加一點哲學的思考、一些生動的比喻,它就會再修改。我甚至曾經要求它用科馬克·麥卡錫的筆觸來寫一個海嘯的場景,出來的文字不一定全都能用,但能給你一些感覺。
它也會生成一些我原來在大綱里沒有涉及的情節,比如兩個女孩第一次見面,會有一些防備心理。那我可以順著這個防備心理的線索再去發展。和ChatGPT一起寫作就像一個開放的寫作實驗,你不需要做任何預設,由意象展開成場景,再加上人物,借由ChatGPT,人物和場景之間發生的故事就不在你預先的設計范圍內了。你就跟著它走,看它怎么把每個機器生成的模塊結合在一起,最后用你人類的審美、文學性的判斷標準再做統一修改。未來的作品,讀者或許根本分辨不出到底哪部分是人寫的、哪部分是AI寫的,因為這里包括非常多不同層次的修改和潤色。
機器所理解的文學性、哲學性,也是基于語言模型,抽象出很多文學作品里所謂的文學性,有時候會過度修飾,比如你讓它加點比喻,它恨不得每句話都來個比喻,你就知道了,機器把握不好這個平衡,而文學性的微妙恰恰在于取舍,在于留白,在說與不說之間,這部分機器還沒有那么智能。它對情節靈活性的掌握,來源于已經學習了非常多歷史上的文學套路,讓它能跳脫出人類作家的慣性。人類寫作很多時候還是會受限于以前的創作路徑,但AI可以從整個人類的數據庫里抽象出非常多的原型,無限多地在原型里做排列組合,去生成無限多的分支結構。
我也嘗試過用ChatGPT去翻譯,真的比我以前用過所有的翻譯軟件都好。它的流暢程度達到了一個新的高度。但我覺得有一些更微妙的東西,包括文化上的符號、引用的歷史典故等等,包括有時候有一些多義性的處理,AI還做不到人類譯者的水平。
甚至包括封面和插畫也可以讓AI參與創作。我馬上要出的一本小說集《贏家圣地》,封面就是我用另一個AI工具Midjourney生成的。當時我看了出版社請設計師做的方案,覺得跟我想象的還是有點距離,就想自己來,在很短時間內生成了數十個版本,篩選之后,讓設計師加上字體——以后可能連這一步都可以由AI代勞。
五年的時間,AI就已經進化成了現在這樣。技術的進步確實遠遠超過我們的預期,這一點是最可怕的。它的進步不是我們習慣的線性增長,而是一個指數性的增長,而且這個增長才剛剛開始。AI提供給我們非常強大的工具,創意的工具、寫作的工具、設計的工具,同時也讓我們思考到底原創性的邊界在哪里,人類的主觀能動性在哪里,包括知識產權,包括怎么尊重被采集數據的作者,他們是否也擁有一定的權利。所有這些問題都在一團迷霧當中尚待被理清和討論。
我們是否將迎來
真正意義上的“文學已死”
如果科技真的到了我們無法分辨人類與機器的地步,哪怕只是語言層面上,都足以顛覆絕大部分行業及社會生活的面貌,因為人類無法離開語言進行思考、表達與交流。許多人類的職業會被替代,企業會高度自動化。機器能夠無窮盡地生產出供人類娛樂的個性化內容,不輸歷史上任何經典的文學、影像或游戲。我們是否將迎來真正意義上的“文學已死”?
用AI寫作之后,我有一個非常明顯的感覺,就是人也好,機器也好,創作的過程其實沒有太大區別。
我們寫作、思考、交流,表達全都是用語言,那創作的本質到底是什么?可能就是把你讀過的東西、你的體驗、你的思考,重新排列組合成一種新的文字組合形式并表達出來,而機器是用一種數學模型來做它的排列組合。人可能要更加復雜,用大腦神經結合情感體驗等等。但我覺得從根本上來講,這兩者的生成過程是非常相似的。就像人的寫作很多時候也是從模仿開始,只不過人的大腦的“算法”是一個更內隱的過程,更像一個黑盒子,會被賦予一種神秘感,一種類似于靈魂的光暈,就是本雅明所說的Aura。而當我們真的試圖去理解GPT到底怎么建出來的,你會發現非常多工程學上的具體實施細節,我們都不知道它的原理是什么,只是通過非常多的試錯來達成。所以,AI跟人的大腦一樣,我們都不知道它的底層邏輯是什么,都是黑匣子,只不過一個是碳基、一個是硅基。
當你看到一個機器,它用這么簡單粗暴的訓練方式,也能寫出讓你覺得“有一些東西”的文字時,就會開始回過頭想,那么多作家、畫家、詩人,這些藝術創作過程里到底有什么人類的獨特性?我現在的答案是,可能并沒有那么的獨特,也沒有那么的不可替代。
隨著AI不斷以這種指數級的速度自我進化、自我迭代,接下來,非常多人類本體的定義、人本主義的基礎會被動搖,這是一個更深刻的東西,可能現在還沒有被討論得特別充分。我觀察到人文學者,包括一些傳統作家,他們面對新的事物還是比較保守,甚至很多會有一種拒斥心理。他會覺得這東西無非就是排列、組合、拼貼,從那么多東西里這兒抄一點、那兒抄一點,但我覺得這個東西可能沒有他們想象的那么簡單。原來大家會質疑AI無法創造新的東西,但現在意識到,人類創造的東西,很多也是通過原有的知識經驗打碎重組,放到新的場景里去運用。
對于我來說,現在寫作中最花力氣的地方反而是在最不花力氣的地方。這么說可能有點玄,它不在收集信息、理解科技、編排人物與拿捏故事原型,而是在于不經過理性思考判斷,從潛意識層面涌現的直覺,也就是“非計算性”的部分。你無法控制它的到來,很多時候只能等待,只能祈禱。這或許是AI尚未通過語言模型學會的部分。
最新的ChatGPT及各種變體已經能夠以超乎想象的流暢程度與人類進行對話以及進行特定領域的寫作,比如財經新聞、體育報道、法律文書、論文摘要……甚至模仿歷史上不同的作家風格進行創作。盡管生成內容的質量還不夠穩定,且時常會犯一些常識性的錯誤,但目前也有科學家嘗試教會機器理解我們所身處的“世界模型”??梢哉f,我們已經生活在這樣的科幻現實中。如果科技真的到了我們無法分辨人類與機器的地步,哪怕只是語言層面上,都足以顛覆絕大部分行業及社會生活的面貌,因為人類無法離開語言進行思考、表達與交流。許多人類的職業會被替代,企業會高度自動化。新一代兒童會更習慣與機器進行交流,相比之下,人類的交流笨拙而低效,充滿了誤解。機器能夠無窮盡地生產出供人類娛樂的個性化內容,不輸歷史上任何經典的文學、影像或游戲。我們是否將迎來真正意義上的“文學已死”?
發展人工智能,也是在認識人類自己,最后你也會去思考智能的本質是什么,意識的本質是什么,存在的本質是什么,它是否也是由語言、符號來定義的,它是否也是從一個混沌海量的數據里面,涌現出來的一種秩序感?而最后的最后,我們不得不質疑意識與智能的本質,因為從表征上已無法區分人與機器,那么,二者的界限在哪里?
如果從人類中心論的角度,未來無疑不站在我們這一邊。但如果將機器也視為我們文明延續的產物,那么我希望,新的智能生命能夠建立起更可持續發展的文明形態,并平等地尊重所有物種,包括非生命的環境本身。按照卡達肖夫指數(Kardashev Scale)對文明的分類,人類連全面利用行星級能源的一級文明都沒有達到,我們沒有任何理由自大甚至自戀,而應該以開放心態接受人類作為通往更高級文明形態(在詹姆斯·拉夫洛克看來是純硅基生命的“新星世”)過渡期的命運。
彼得·沃茨的《盲視》以及最新一季《愛死機》里面的“蟲群”,其實說的就是這樣的無意識集群智能文明,自我意識對于它們來說是一種低效無用的冗余功能,就像盲腸一樣。但我同樣認為,在那樣一種文明形態中會有不同水平的意識涌現,也許是宇宙級別的分布式意識,它成為塑造時空與不同維度現實的基礎,而我們現在人類所謂的意識與文明,只不過是其中渺如煙塵的分型與投射。但仍然,人類有自己的命運,有自己的旅程,就像古希臘神話《奧德賽》一樣,奧德修斯歷經磨難,戰勝了巨人與怪物,最后衣錦回鄉,但他已經不再是原來的自己,他回到的也并不是原來的故鄉。他領悟到更大的使命與歸屬,那種崇高感或許是跨越了一切物種與文明界限的終極意義。
而文學,毫無疑問正是承載這種文明崇高感與人類鄉愁的意識織體。它將伴隨著我們一直航向歷史的盡頭,無論掌舵者究竟是人類,還是機器。