Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
Adobe因在AI模型开发中未经授权使用作者作品而面临法律挑战
Adobe对人工智能的激进扩展正面临重大法律挫折。该公司被指控将盗版文学材料纳入其机器学习基础设施——此举引发了一场以版权侵犯为中心的集体诉讼。
核心指控
来自俄勒冈的作者Elizabeth Lyon提起了一项拟议的集体诉讼,声称Adobe在为其专门用于移动文档处理应用的语言模型SlimLM进行训练时,未经授权使用了包括她自己著作在内的书籍副本。据法院文件显示,这些文学作品在未获得作者同意或补偿的情况下被纳入。
盗版书籍如何进入Adobe系统
这一涉嫌滥用的路径可以追溯到由Cerebras在2023年中发布的公共数据集SlimPajama-627B。Adobe依赖该数据集对SlimLM进行预训练。然而,诉讼揭示了一个有问题的链条:SlimPajama本身是由RedPajama派生而来,后者又通过整合Books3——一个包含191,000部已出版作品的庞大存储库——而形成。
关键问题在于:Books3据称包含未经授权收集的受版权保护的材料。当Adobe在此基础上进行构建时,该公司被指继承了这些版权违规行为。正如Lyon的法律团队所指出的,SlimLM成为了包含未授权文学内容的衍生作品。
行业中的模式逐渐浮现
Adobe并非第一个面临此类指控的科技公司。支撑现代AI系统的基础数据集已成为版权争议的雷区:
这为何重要
AI模型的普及需要大量的文本数据。当开发者从Books3或RedPajama等合集来源获取数据时,如果未能彻底核查其合法性,就会带来制度性风险。不断出现的诉讼表明,依赖这些数据集——无论多么方便——如今都面临着巨大的法律风险。
对于Adobe及类似公司来说,信息变得越来越清晰:在训练数据来源上偷工减料,可能比合法授权的成本要高得多。