巨魔_芋 26-03-19 07:20

哎,不是,油饼吧[怒][怒][怒]
去年三月有人从凹三爬了6320万篇同人放到Huggingface上用来喂生成式AI,受影响的作者做了个检索网站,我输了去年的ID看了一眼,全被爬了[无聊]
凹三的髪务团队依据DMCA向huggingface交涉,现在huggingface上的这个数据集已经被删了(检索网站只是用来检测之前这次大规模爬取有没有爬到你的文,如果你的文在25年三月之前是公开的就大概率被爬,事后上锁不会改变之前这次抓取的结果),但是不好说未来会不会有人再搞这套。大规模爬取会被髪务团队处理,但如果有些人私下偷偷搞小规模爬取,很多作者甚至发现不了。
自从去年之后全设置成仅登录可见了,本来还想考虑要不要放开访客可见,在这个网站搜了一下立刻打消了解锁的念头[柯基]
那个在某薯转载这条内容的博主请你把我的原帖链接带上,不要到处偷偷[微笑]这样起号你家里人知道吗[微笑]

发布于 美国