《纽约时报》,人工智能正在撰写小说,出版业却尚未做好准备A.I. Is Writing Fiction. Publishers Are Unprepared.
图书出版领域几乎没有有效的防护措施,来防止那些大量由人工智能生成的小说在不知情的情况下被出版。
数月以来,网络上不断有人猜测,一本颇受关注的恐怖小说《Shy Girl》在创作过程中使用了人工智能。
这本小说讲述了一名绝望的年轻女子被一名在网上结识的男子囚禁,并被迫作为其“宠物”生活的故事。该书于2025年2月以自出版形式发行,很快在恐怖小说读者中获得关注。随后,阿歇特出版集团(Hachette)于去年秋天在英国出版了该书,并计划于今年春天在美国发行,宣传其为“一部毫不掩饰、极具冲击力的复仇恐怖小说”。
今年早些时候,人工智能检测程序 Pangram 的创始人兼首席执行官 Max Spero 听闻有关《Shy Girl》的争议后,决定对全文进行检测。结果显示,该书约有78%的内容由人工智能生成。
“我非常有信心地认为,这本书在很大程度上是由人工智能生成,或者至少严重依赖人工智能辅助完成,”Spero表示。他在1月将研究结果发布在社交平台X上。
自《Shy Girl》在英国出版以来,越来越多读者在网上表达怀疑,指出书中存在不合逻辑的隐喻以及奇怪、重复的表达。随着1月底关于该书由人工智能生成的指控不断发酵,阿歇特始终未作回应。
在《纽约时报》就相关指控提出询问后,阿歇特表示,其旗下Orbit出版社已取消在美国发行该书的计划,并将停止英国版的销售。
《Shy Girl》的作者Mia Ballard在其作者简介中称居住于加利福尼亚北部并创作诗歌,但她在社交媒体上几乎没有存在感,也未公开回应有关人工智能的质疑。周四通过电子邮件联系时,她表示暂不评论。
阿歇特发言人称,取消出版决定是在经过“长时间且全面的分析”后作出的,并强调公司重视人类创作,要求作者声明其作品为原创,同时也要求披露是否使用人工智能。
《Shy Girl》似乎是首部因涉及人工智能使用而被大型出版商撤回的商业小说。此举表明,人工智能写作不仅存在于泛滥于亚马逊的廉价自出版电子书中,也正渗透进传统出版领域。
令人震惊的是,《Shy Girl》竟能通过编辑流程,甚至在英国正式出版之后,出版方才对人工智能使用展开深入调查。这反映出出版行业在应对人工智能崛起方面准备不足,也预示着一个充满不确定性的新时代正在到来——编辑和读者越来越难判断他们所读的文字究竟出自人类还是机器。
由于人工智能写作在伦理和应用上争议巨大,很少有出版人愿意公开讨论其应对方式。但一些业内人士担忧,这一趋势几乎无法阻挡,尤其是在技术迅速进步的情况下。
格罗夫大西洋出版社(Grove Atlantic)出版人 Morgan Entrekin 表示:“这就像抄袭问题——你只能依赖作者的诚实。我们必须对合作伙伴保持信任。”
目前,人工智能对出版业最明显的冲击仍集中在自出版领域。作者们表示,这一生态已经被大量“人工智能垃圾内容”淹没。但业内人士普遍认为,越来越多依赖人工智能的作品进入大型出版社只是时间问题。与此同时,自出版作品被传统出版社收购并再版的趋势也在加剧这一风险。
出版业顾问 Thad McIlroy 表示:“这不仅是不可避免的,我们已经身处其中。”
在得知《Shy Girl》的相关指控后,McIlroy获取了该书,并委托 Pangram、GPTZero 和 Originality.ai 三个检测工具进行分析。三者均认为该文本很可能主要或部分由人工智能生成。Pangram报告还标记了一些典型句式,例如“那一刻的停顿像刀子刺进我的胸口,锋利而不容抗拒”,以及“我把手机贴在嘴边,屏幕冰冷而不容抗拒”,认为这些表达具有聊天机器人写作的特征。
目前几乎无法准确统计有多少人工智能写作已被出版,但已有迹象显示该技术正在推动图书数量激增。根据行业数据机构 Bowker 的统计,去年自出版图书超过350万本,高于2024年的250万本;传统出版社则发行了超过64.2万本新书。
石溪大学(Stony Brook University)计算机科学教授 Tuhin Chakrabarty 使用 Pangram 对亚马逊上超过1.4万本自出版小说进行检测,结果显示近20%的作品在很大程度上由人工智能生成。在对2024至2025年出版的小说进行分析时,他发现人工智能生成内容占比较高的作品同比增长了41%。
尽管人工智能检测工具有时会误判人类写作,但 Chakrabarty 表示,他对 Pangram 的结果有信心。该程序通过识别大型语言模型(如ChatGPT和Gemini)常见的语言模式来判断,并能识别经过人工修改以掩盖痕迹的文本,其误判率约为万分之一。
在筛选出大量疑似由人工智能生成的自出版小说后,Chakrabarty进一步关注那些读者反响较好的作品,并依据 Goodreads 的评分数量和平均分进行排序。
按评论数量排名,《Shy Girl》位列前列,拥有超过4840条评分,平均为3.5星。
不过,该页面的第一条评论只给出一星,评论者写道:“我几乎可以确定这是用ChatGPT写的。”
许多出版商并未在合同中明确禁止作者使用人工智能,而是依赖传统条款,要求作者声明作品“原创”。如今,许多人将这一条款解读为事实上禁止使用人工智能生成文本或图像。
出版商对人工智能内容持谨慎态度的另一原因是,目前人工智能生成的文本和图像无法获得版权保护。同时,由于人工智能在研究、构思等环节的广泛应用,界定其“合理使用”范围仍然困难。这使得出版商面临潜在风险——无论是蓄意欺诈者,还是误认为自己行为合理的作者。
监管作者使用人工智能的难点之一在于,大多数大型出版公司并不愿完全禁止其使用。编辑们承认,作者在创作过程中以不同方式使用人工智能并不罕见;同时,出版公司自身也希望将该技术用于营销文案、音频制作和翻译等工作。
然而,缺乏明确界限正加剧混乱:小说家是否可以借助人工智能构思情节、提供不同结局,或润色草稿,并仍将作品视为原创?在什么程度上,作品不再属于人类创作?
对作者使用人工智能的广泛质疑,也让出版商处于尴尬境地。许多人仍将传统出版视为原创文学的最后堡垒,由编辑精心筛选与打磨。但如果人工智能能够写出引人入胜的小说,而读者与编辑又无法辨别其来源,这一地位可能受到冲击。
美国作家协会(Authors Guild)首席执行官 Mary Rasenberger 表示:“这确实是个问题,我们必须设立某种规范。”该协会正在代表作家对OpenAI和微软提起集体版权诉讼,指控ChatGPT在训练过程中非法使用受版权保护的作品。(《纽约时报》也已就相关新闻内容版权问题起诉OpenAI及其合作伙伴微软,两家公司均否认指控。)
她补充道:“一些出版商和作者认为人工智能的质量尚不足以与他们竞争,但我认为,随着新一代大型语言模型的发展,这种看法并不成立。”
在作者与读者之间,人工智能写作依然极具争议。一些人认为,如果读者未被告知作品包含机器生成内容,这等同于作弊;另一些人则认为这是一种“盗窃”,因为许多生成式人工智能是在未经许可的情况下使用受版权保护的作品进行训练。
文学经纪人 Seth Fishman 表示,他代理的作者大多反对使用人工智能写作。
“对作者来说,这不仅是技术问题,更是道德问题,”他说,“他们觉得自己的作品被偷走了。”
在《Shy Girl》事件之前,业内已经流传一些“险些发生”的案例——出版商在出版前发现人工智能使用并及时叫停。
例如,一位大型出版社的编辑曾质疑某作者新书中部分段落为何显得平淡乏味。作者最终承认,他在修改过程中使用了人工智能。
另有一家出版社发现其已购入的一本书包含人工智能辅助内容,并决定取消出版。相关员工因合同保密条款拒绝透露更多细节。
目前,对于如何筛查未披露的人工智能内容,业内尚无共识。一些编辑和经纪人认为,出版商应明确人工智能使用规范,以防止作者因误解或故意隐瞒而违规。
美国最大的出版公司企鹅兰登书屋(Penguin Random House)已制定相关指南,为作者和插画师设定人工智能使用范围,其原则与合同中的“原创性”条款一致。其他大型出版商,如哈珀柯林斯(HarperCollins)、西蒙与舒斯特(Simon & Schuster)和麦克米兰(Macmillan),则未详细说明具体政策,仅表示仍以原创性条款为依据,一位发言人补充称麦克米兰会“个案处理”。
不过,一些人担心,围绕人工智能的模糊态度以及其在文学界的负面形象,反而可能促使作者隐瞒使用情况。
Chakrabarty表示:“如果这件事被遮遮掩掩,不愿公开讨论,人们就更可能滥用它。对人工智能的羞耻感反而带来了更多问题。”#海外新鲜事#
