<abbr id="gucoo"></abbr>
<li id="gucoo"></li>
  • 
    
  • <abbr id="gucoo"></abbr>
    <li id="gucoo"><source id="gucoo"></source></li>
    <rt id="gucoo"></rt>
  • 用戶登錄投稿

    中國作家協會主管

    AI創作出百萬字小說,“人人皆能寫長篇”不再是夢 ——華東師范大學教授王峰談《天命使徒》
    來源:光明日報 | 劉江偉  2024年07月06日09:32

    編者按:

    2024年6月22日,本版刊發一組文章,在理論層面從不同維度探討了人工智能(AI)寫作帶給網絡文學的影響。事實上,國內已有成功使用人工智能創作網絡小說的實踐:《天命使徒》長達100萬字,使人工智能創作長篇文學成為現實;《機憶之地》匿名參加科幻文學大賽,在評委不知情的情況下獲二等獎。本期繼續圍繞人工智能寫作與網絡文學的話題進行討論,兩篇人工智能小說的創作談表達了未來人工智能網絡文學創作的豐富前景,而青年評論家康春華則從兩篇小說的文本出發,指出了人工智能小說創作所面臨的難以逾越的難關和障礙。

    人工智能在短篇文學尤其是詩歌創作上有所建樹,但超長文本創作一直未能實現。這幾年人工智能技術突飛猛進地迭代,人工智能文學創作也在不斷打開新的可能。

    近日,華東師范大學教授王峰團隊取得一項重大突破——他們成功創作出一部百萬字的人工智能小說《天命使徒》,標志著人工智能在長篇文學創作方面邁出重要一步。

    《天命使徒》采用“國內人工智能大語言模型(以下簡稱“大模型”)+提示詞工程+人工后期潤色”的方式完成,整部小說超過110萬字。一個勤奮的網絡作家寫作如此篇幅的小說大約需要一年,而人工智能機寫僅用了一個半月。王峰團隊的下一個目標是將這一時間縮短為兩至三周。

    “文學正經歷著飛速的變化。我們在暢想未來的時候,很可能也正在見證某些奇跡的發生。”王峰如是表達著人工智能網絡文學創作的前景。

    記者:《天命使徒》講了什么樣的故事?它是怎樣被創作出來的?

    王峰:《天命使徒》描寫了修仙者周青不斷發現自我,在黑暗和光明兩極間搖擺,最后犧牲自我,不再做孤獨的守護者,而要做一個與所愛之人共享平凡日常的普通人的故事。人工智能小說,不是全部脫離人,而是人機協作,整體結構由人決定,細節描寫由人工智能完成,這是一種新的創意寫作方式。在創作時,我們首先對網絡小說的結構進行了深入研究,分析情節脈絡,撰寫大量提示詞,然后在人工智能大模型中批量生成內容,形成整體線索連貫的長篇小說。后期通過人工介入,對大模型生成的小說進行修改,刪除重復、累贅的部分,為情節跳躍的部分撰寫連接語句,最終打磨成型。

    記者:小說呈現了什么樣的風格,是否實現了預期效果?

    王峰:小說整體線索能夠保持一致,語言具備了一定的文學性,比如開頭這樣寫道:“他緊張地握緊了手中的武器,指尖在冰冷的金屬中尋找一絲安慰。他的心跳如同在狂風中的鼓點,敲擊著他的胸膛。儀式即將開始,他需要做的,就是走向山谷中心的火光處。”但是,在細節方面還存在大量跳躍和重復之處,需要人工修改。比如,大模型對每個提示詞的生成內容都是有始有終的,會為每次生成內容添加一個結尾,我們稱之為“光明的尾巴”,這個就需要后期調整。在語言上,人工智能小說表現出一種愣呼呼的風格,不少大模型生成的作品都是論文腔,我們只能不斷微調本地大模型來提升表達水平。下一步我們會訓練出一個專注于文學(小說)創作的大模型,讓“人人皆可寫作長篇”成為可能。

    記者:人工智能會根據提示詞順利生成適合的內容嗎?創作過程中做了哪些調整?

    王峰:提示詞被業界親切地稱為“耳語者”,要提供情節、環境、人物情緒及事件等信息。一開始,我們希望大模型能夠生成符合我們期望的文本結果,但現實是大模型的生成結果往往顯得有些“失控”。我們努力進行控制,但很快發現,幾乎所有的控制都無法完成任務。提示詞長了不行,短了也不行。將提示詞輸入大模型時,每次生成的內容都不一樣,如果重復輸入六七次,所生成的內容就開始重復出現了,這讓我們感到有些手足無措。后來我們領悟到:既然無法完全控制大模型的輸出,何苦一味追求符合自己完美構想的結果呢?這或許正是大模型本身的特點。“失控”不是它的缺點,而是它的變量,試圖讓它按照我們的期望產生完美的文本結果幾乎是不可能的。所以,我們不斷調整提示詞內容,只為小說提供一個大致走向,使情節保持連續性,而具體故事細節就交給了大模型。

    記者:為什么說超長文本輸出仍是人工智能的局限?未來的人工智能小說創作將是什么樣的圖景?

    王峰:目前,人工智能創作仍是一問一答的形式,無法實現持續輸出,我們要源源不斷提供提示詞。對每個提示詞,國內大模型平均會生成500字的內容,所以創作100萬字的小說,就要提供2000個提示詞。其實,大模型的長文本處理能力主要體現在其閱讀理解能力上,它首先要理解我們的創作意圖,然后生成連貫性的語句。

    技術是快速迭代的,隨著更多大模型的研發應用,超長文本輸出和人工智能閱讀理解能力將不是問題。舉個例子說,我大約在三年前開始組建團隊,探索智能寫作的方法。當時,邀請了計算機、文學、語言、哲學、古籍、數學、地理等多個領域的研究者共同探討,基于當時的大模型技術制定了創作方案。但是,2022年底,國外某個大模型的換代升級給我們先前的設計帶來巨大沖擊,曾經的很多問題不再是問題。眼下人工智能技術如龍卷風般迭代,我相信現在的很多困惑和難題將來都會迎刃而解。

    目前,人工智能在文藝創作上主要影響網絡文學,因為網絡文學寫作模式化、類型化比較強,寫作者可以借助大模型的幫助進行各個部分的細節寫作,比如人物生成、物品生成、人物關系圖譜生成、段落寫作等。這些功能都已經實現,只是質量還不高,留有相當大的探索空間。

    記者:很多人擔心人工智能創作的版權問題。您怎么看待這個問題?

    王峰:關于人工智能創作的版權問題,業界正在探討。我個人理解大致可分為兩個方面:一是訓練語料的問題,二是生成產品的歸屬問題。前者目前是最主要的瓶頸,首先我們需要獲得公開語料,并對其進行進一步加工,這在研究范圍內是允許的。如果進行商業化運作,就存在備案等問題,我認為一定要尋找大模型發展與語料權利保護的平衡點。至于后一個問題,生成的產品著作權到底是部分歸智能平臺部分歸個人,還是全部歸個人,要看具體的約定。這些都是未來智能寫作無法避開的問題,需要研究者和實踐者共同探討。