《纽约客》的文章,用人工智能写书,算不算错?Is It Wrong to Write a Book With A.I.?
创作权的本质并不像看上去那样简单。
作者:Joshua Rothman
你正在阅读《开放问题》,这是Joshua Rothman每周一次的专栏,探讨成为人的意义。
1980年推出的Roland TR-808是一台字典大小的鼓机,重达11磅,售价1200美元,技术上堪称前所未有。虽然鼓机已经存在几十年,但它们通常只能使用预设的声音(军鼓、低音鼓、踩镲)演奏预设的节奏(狐步、华尔兹、波萨诺瓦)。相比之下,808配备了内置计算机,允许音乐人编程自定义的声音和打击乐模式,这些模式可以排列成长曲序列自动播放。
刚上市时,几乎没人知道该如何使用它。产品很快停产。但随后二手价格暴跌约九成,音乐人开始购买二手808尝试实验。这些机器很快帮助创造了无数热门歌曲(Marvin Gaye的《Sexual Healing》,Whitney Houston的《I Wanna Dance with Somebody》),并开始对流行音乐产生与电吉他相媲美的影响。音乐人发现,他们可以独自使用机器创作音乐,追求个人化的艺术愿景,无需妥协或合作。他们利用机器自豪的合成音色和模式化逻辑创造了独特的新流派——电子、舞曲、嘻哈。
如今,808的声音随处可闻,而且立刻能被辨认。或许不那么显而易见的是,808及其衍生技术的作曲结构同样无处不在。许多歌曲现在都是在计算机上创作,使用音序器、模式和循环,音符在4/4节奏网格上精确排列。音色设计——低音鼓或合成器扫弦的特定音质——往往定义了一首曲目的身份。更广泛地说,音乐人已不再受限。要创作出精彩的音乐,他们不需要懂音乐理论,甚至不必拥有乐器;通过合成器和采样,他们可以扭动旋钮移调和弦,或从下拉菜单中选择交响乐团。实际上,他们可以创作出地球上任何乐器都未曾产生过的声音,而听众也会心甘情愿地跟随他们进入新的音域。传统乐器并未被取代——我们依然听原声吉他——但它们已存在于更大的合成音乐景观之中。
假设“艺术型”人工智能的发展故事大致沿着鼓机的轨迹展开,那么我们现在处于哪一阶段?也许相当于1983年——808的继任机型909面世的年份。(要听差别,可以比较Gaye的《Sexual Healing》和Madonna的《Vogue》。)当时,电子音乐仍属新兴领域,人们抱有各种反对意见。他们认为,电脑化乐器不需要音乐才能或天赋,其音色本质上笨拙、缺乏表现力。(对部分音乐人来说,这正是其魅力所在。)有人认为,用机器创作的音乐缺乏汗水与即兴碰撞的灵魂。(对另一些人而言,这种冷漠恰恰令人欣赏。)人们担心电子音乐会让音乐人失业。(美国音乐家协会曾反对30年代的录音音乐,也曾抗议808的工程师Don Lewis的演出。)许多知名制作人坚持认为,鼓机可能在创作过程中有用,但不应出现在最终录音中。很多听众则觉得,从根本上说,电子音乐就是错误的,是欺骗,是在破坏音乐本身。
所有这些担忧都有其合理性。但它们在民主化、创造力和品味的力量面前显得微不足道。事实证明,电子乐器吸引了大量人参与音乐创作,而这些人以聪明、有趣、感人的方式使用它们;听众也喜欢听到这样的作品。面对《It’s Tricky》和《Planet Rock》,以及《Born Slippy》和《Nothing Compares 2 U》,几乎无法争辩。于是,如果类比成立,那么说用人工智能创作的艺术自动就是虚假或低劣,很快也将站不住脚。工具本身不会决定艺术的价值——关键在于它们被如何使用。
平行线总有分歧之时;我们也可能得出结论:人工智能非同寻常,不应进入我们的艺术生活。这似乎是近期被揭示部分由人工智能生成的恐怖小说《Shy Girl》的教训。小说讲述一名年轻女性被其“甜心爸爸”囚禁为“宠物”的故事,最初自费出版,在网上收获了大量读者,后来被出版商Hachette收购。几个月前,读者开始指出其文字风格似乎合成化:过多的形容词和比喻,以及聊天机器人般单调、均一的语气。A.I.检测公司Pangram分析后宣称,《Shy Girl》78%的内容由人工智能生成。作者Mia Ballard表示,她交给自由编辑的手稿可能未经她同意被处理过人工智能。最终,Hachette取消了出版计划。
读到这里,你可能会想象这是一场侦探故事,在线技术高手逐渐揭示小说的合成性质。但实际上,这部小说从开头起就显得人工智能感十足:
我穿着一条粉色连衣裙,那种承诺柔软却毫无柔情的裙子。薄纱脆而尖锐,刷过我的毛发,如同成千上万的小牙齿,每一次移动都是残酷的爱人咬合。每一道划痕都让我被束缚,这是我存在的提醒:我是宠物,是被塑造成供人观赏、赞美、指挥的物件。
如果你对人工智能生成的声音和节奏耳熟能详,你几乎能立刻辨认出来。在你看来,《Shy Girl》可能显得程式化。仿佛作者没有编写自己的节奏模式,我们只能听到机器的预设桑巴与恰恰。这对很多人来说,是使用人工智能写小说最明显的反对理由:它听起来根本不好。
然而,小说的价值不仅仅在于文笔。在亚马逊上,《Shy Girl》收获了四星好评,基于数百名读者的评价。许多人称赞其故事设定和创意——这些部分很可能受到了人类决策的影响。(一名读者描述自己知道小说“有争议”,但依然喜欢:“故事设定让我入迷。”)大局来看,许多小说写得很糟,但仍能获得读者青睐。就像音乐一样,小说也是一种宽容的艺术形式。一首好歌可以有动感节拍却旋律平淡,一部小说也可以在某些层面成功而其他层面欠佳。只要读者被打动——悬念、美感、现实感、幻想,甚至只是能在主角身上看到自己的影子——局部成功就足够了。
如果小说创作是一项层次分明的工作——前提、情节、风格等在某种程度上是可分离的——那么所有层次都必须由同一个人完成吗?这个问题早已被从事不同创作领域的作家实践回答过,他们经常以团队形式工作。James Patterson(詹姆斯·帕特森)是美国畅销书作家,他几乎每卖出十七本精装小说就有一本由他提供详细大纲和故事梗概,由合作者完成的作品。有人将他的创作方式形容为“小说工厂”。(他可能同时监督三十个项目,每年出版十五本书。)这种做法完全把他逐出了“文学小说作家”的传统范畴;有人甚至质疑帕特森是否算真正的作家。但我们的期待因语境而异,这些隐含的理解通常未被明确说明。在阅读布克奖获奖小说时,我们期望每一个字都出自同一作者之手;但阅读新闻报道时,我们默认作者和编辑都参与了作品的生成。我们常常在更大项目中对创作协作持宽容态度,例如电影——本身就是高度协作的产物。当编剧获得奥斯卡最佳原创剧本奖时,“原创”只意味着剧本非改编作品;最终成片可能有大量人员参与,无论是否署名。也许我们对作者协作更宽容,是因为这种协作是更大项目的一部分,而这些项目本身就 inherently collaborative。但如果更大项目是1993年以来持续出版的Patterson的“Alex Cross”系列呢?单凭个人不可能完成如此大量的作品——工厂模式是必须的。
看起来,作家必然会使用人工智能来启动自己的“工厂”。今年二月,《纽约时报》的Alexandra Alter采访了一位使用人工智能快速创作数百本小说的伪名言情小说作家Coral Hart。她在亚马逊以数十个笔名自费出版小说。Hart在提示系统后,AI可以在四十五分钟内生成可供人工修改的初稿(例如关于“一个牧场主爱上从城市逃来的神秘女孩”的故事)。Alter报道,Hart的小说尚未出现畅销书,但她通过这种方式赚取“六位数”收入,并开设在线课程,教授有意通过AI辅助创作言情小说的新人。故事暗示了未来可能出现的工业化、去个性化的小说生产模式:作者成为“编剧总监”,监督AI写作团队。当然,一个风险是,读者可能无法知道参与创作的究竟是人还是机器,这会破坏他们对作品的隐性理解。(亚马逊要求Hart披露使用AI的情况;她有时并不遵守。)
但人工智能提供的唯一可能就是高产吗?很多取决于你的目标和视角。我是一个非常业余的音乐爱好者,技术确实提高了我的产量。在电脑前,手握仅两八度的MIDI键盘,我可以高速完成作曲步骤;理论上,我一天能发两首歌,一周能写一张专辑。但我并没有这样做。我使用音乐技术,是为了实现我想要的效果。我不可能为观众演奏——我弹不出十二小节钢琴而不出错——但这不是我的目的。我只是想让头脑中的声音得以“听见”。夸张地说,我想实现自己的音乐设想。
可以推测,许多有抱负的作家也抱有相同心态:他们有想法,却无法独自实现,需要提示、辅助、模板或初稿。在从业余迈向专业的过程中,我们当然更期望作品反映创作者的“真实”能力。但什么才算真实?通过音频软件公司Spitfire,获奖的冰岛作曲家Ólafur Arnalds提供了一款名为Cells的工具,它能“听”你弹奏,并在此基础上生成闪烁的管弦乐云,带有“遵循作曲者调性”的和声运动。许多类似的幕后工具帮助专业音乐人,将即兴想法转化为完成作品。Cells产生的不断变化的弦乐听起来惊艳,你很可能在影院听到类似效果。这不是人工智能——但几乎可以算作。它毁掉了音乐的本质吗?
写作不同——我们有理由这样看。我对此抱有同情。我以写作为生,这意味着我热爱写作本身,也热爱自己动手写作,不借助AI。我对好写作有一种崇高的理解。当人们问我职业时,我会说自己是记者;我不喜欢用“作家”自称,因为觉得不够资格。我用一生积累的技能,熟练解决常困扰不那么有经验作家的技术问题。但更高层次、更具灵感的写作——想象力、艺术性、灵感——仍然有些遥不可及。
我对写作工艺的尊重,是更广泛视角的一部分。在二十多岁时,我读过英语研究生课程,教授们都是极具才华的细读专家。其中一些人,如诗歌评论家Helen Vendler,成长于“新批评”时期——这一学派主张最佳阅读方式是逐字逐句检查,探究每一个标点和词语的作用。最影响我的教授Philip Fisher教我们阅读“经典”小说——《傲慢与偏见》《卡拉马佐夫兄弟》——并能解析场景之间的对位关系、情节线索与语言层次如何交织,构成意义。
学习不仅仅是理解思想。大学有罕见书籍馆。讲授《尤利西斯》时,我给学生展示了乔伊斯标注的校样:他们能看到他在边缘加上第二个“Yes”,完成茉莉布鲁姆独白的尾声。另一堂课上,我们看到Charlotte Brontë与兄弟Branwell在孩童时期创作的迷你手工书籍。这些文物证实,写作既是一生的事业,也是生活方式。写作,是心智的最高用途之一。
在那样的氛围里,很容易对“写作”有某种既定认识。我知道,无论写作活动本身多么困难、神秘、重要,甚至在后现代意义上“并不稳定”,它同时也是直接且明确的。在其他艺术形式中,创作者的角色可以更复杂,作品的身份也更为流动。音乐中有Brian Eno;绘画中有Andy Warhol;雕塑中有Andy Goldsworthy;电影中有Werner Herzog;行为艺术中Marina Abramović依赖观众参与;Jeff Koons是C.E.O.-艺术家,运营生产线。各种方式表明,艺术家正在利用技术扩展自身、改变与艺术的关系。但文字创作,我曾以为仍相对独立。
虽然实验文学中,作者角色可以被调整;在流行小说中,作者身份可以灵活。但“真正的”写作——文学意义上的——仍然简单。
如今,人工智能正突破围绕写作的壁垒,这种简单性将不再被假设。但同时,传统方式的优点——曾几乎无需言说——也更加凸显。在自动调音或AI合成的世界里,完美与瑕疵有了新的含义:技术抹平的人为错误,反而完美;技术制造的光滑表面,则可能显得空洞乏味。Daft Punk成员Thomas Bangalter在2009年对艺术杂志Whitewall说:“我们与技术的关系非常矛盾,既爱又恨。现在没有限制了。”他接着说,“任何人类行为都必须置于某种挫折之下。”扩展创作过程的技术,也可能短路它。成为艺术家,Bangalter总结:“你必须学会克制——给自己设限。”#海外新鲜事#
