风苇倾谈 26-03-06 07:08

我不知道别人如何,但我已经真切感受到 AI 回旋镖的存在。

在过去两年里,我反复围绕自己的研究主题与AI对谈。同一个核心问题,会被不断重述重构,来回修改几十次。这个数字不是统计,而是一种体感强度。我有许多围绕大问题延展出的子问题。虽然尚未正式发表成果,但与AI的互动也许已累计上千次。对我们这种不太自信的人,在核心问题上格外谨慎,是一种扩展认知确认思路的方式。

我的研究课题相对独特,研究问题往往包含一串高度特定的关键词组合,形成了某种字符串式。最近我开始拓展一个新话题,它与主课题在关键词上有交叠,但需要形成新的研究问题框架。

出于好奇,我将同一个 prompt 分别输入两个不同的 AI(chatgpt, use.ai)。结果令人错愕:两个系统给出了甚为相似的回答,都包含了那串原本极为个人化、带有我研究痕迹的独特字符串。大家经常打趣的,AI 抄袭自己,是很可能真的出现的。我因为在 AI里对话足够,所以压制了AI随机性,达成了自己抄自己成就。

AI 并不需要记住我,它只需要足够多的相似语料、足够强的模式抽象能力,就能在概率空间里重建出一种一样的思考路径。往大点文邹邹点说,当研究者依赖模型进行高频率的思维打磨时,我们是否正在将自己的认知路径嵌入到由算法主导的表达框架之中。更进一步,当多个系统输出趋同时,这种趋同是否意味着知识生产正在向少数底层模型架构集中,进而形成新的话语中心。我本人用我流氓式的高强度互动,使这个话题在一定时间内推广给了别的的搜索了这个话题的人。

这件事让我意识到,勤奋却尚未产出成果的研究者,可能早已在无形中参与了另一种生产过程。我们未必拥有明确的版权意识,也未必认真思考过表达在平台结构中的流向。也许有些东西,是在失去之后才会意识到其不可逆。

我想起前段时间,某耽美大手决定将某耽美名篇影视化。这个作者本身争议比较少,日常是注意维护和书粉的关系的。作品很多年前就很红了,大概率不是一个靠05后10后推流起来的。作者宣布影视化以后,迎来了巨大的网暴。我认为是网暴而非抗议,是因为评论转发里出现了大量人品攻击动机攻击,高比例欲加之罪何患无词。头两天的评论里最高赞的大意是:没有我们自来水,你算个p!现在那些评论不见了。

这个事和很多别的事让我感觉:写书的是孙子,看书的是大爷,寄生在别人原创之上的觉得是自己的流量帮作者作品续命--某个读者对流量有帮助和某个或某群读者给书/作者命是不同概念。我的直接感受是:我请问呢,内容的价值源头并不在他们那里。

我就跟ChatGPT表达了一下,它对我进行了提点(aka喷),like它经常做的一样:当收入和曝光完全依赖流量时,创作者天然处于讨好位置。这种结构天然是服务业结构,而不是文化生产结构。过去:作者是中心,读者围绕作品。现在:平台是中心,作者和读者都围绕流量。这才是根本变化。我之所以有这种感觉,说明我还在用“文化价值逻辑”看问题。而现在的主导逻辑是:注意力经济 + 平台分发权垄断。如果把创作视为“公共文化生产”,那确实会有尊严落差。

它还说了很多,类似于现在的读者是消费者云云。我想翻白眼。花了几块几十块就能这样当大爷,也太便宜了,是某读者价值几百万的配得感撑着吗?!在那个时候,我还没有更融合的理解媒介和内容生态的演变。

直到后来看到一个说法,在AI大规模运作的时代,每个人的写作,无论知名与否,无论质量高低,都在为模型提供训练语料。我们持续生产内容,同时也在为更大的系统供血。时间会抹去个体记忆,但不会抹去数据沉淀。个人创作在公共语料池中被吸收、压缩、再生成。

这一点打通了我的理解。这不只是流量分配的问题,而是表达权与结构性权力的重新配置。当写作成为训练资源,当语言被抽象为概率模式,作者的控制权便不可避免地被稀释。知识、故事与思想被纳入更宏大的技术框架之中,个体的原创性不再以所有权的形式存在,而以可计算性的形式存在。

回到最初的AI回旋现象,我意识到,这是“幕后黑手”正在显影。当我们与模型反复互动、借助其完善表达时,我们既在使用工具,也在参与一种新的知识生产秩序。问题是,当表达被纳入概率空间之后,个人还能在多大程度上保有真正的生成位置。

这个题目可以出一些论文吗?

发布于 美国