Adobe стикається з юридичним викликом через несанкціоноване використання робіт авторів у розробці моделей штучного інтелекту

2026-01-19 13:26:48

Генерація анотацій у процесі

Рішуче розширення Adobe у сфері штучного інтелекту стикається з серйозним юридичним відступом. Компанію звинувачують у використанні піратських літературних матеріалів у своїй інфраструктурі машинного навчання — крок, який спричинив позов про колективний позов, зосереджений на порушеннях авторських прав.

Основне звинувачення

Автор Елізабет Лайон з Орегону подала пропонований колективний позов, стверджуючи, що Adobe використала несанкціоновані копії книг, включаючи її власні твори, як навчальний матеріал для SlimLM, спеціалізованої мовної моделі компанії, розробленої для мобільних додатків обробки документів. Згідно з судовими документами, ці літературні твори були включені без згоди автора або компенсації.

Як піратські книги потрапили до системи Adobe

Шлях до цієї ймовірної зловживання веде до SlimPajama-627B, публічного набору даних, створеного Cerebras і випущеного в середині 2023 року. Adobe покладалася на цей набір даних для попереднього навчання SlimLM. Однак у позові розкривається проблематичний ланцюг: сам SlimPajama був отриманий з RedPajama шляхом включення Books3 — великого репозиторію, що містить 191 000 опублікованих робіт.

Ключова проблема: повідомляється, що Books3 містить авторські матеріали, зібрані без належного дозволу. Коли Adobe побудувала на цій пошкодженій основі, компанія, ймовірно, успадкувала ці порушення авторських прав. Як зазначає юридична команда Лайон, SlimLM став похідною роботою, що містить несанкціонований літературний контент.

Виникає шаблон у галузі

Adobe навряд чи перша технологічна компанія, яка стикається з такими звинуваченнями. Основні набори даних, що живлять сучасні системи ШІ, стали мінним полем для спорів щодо авторських прав:

Модель штучного інтелекту Apple: У вересні Apple було подано позов за нібито навчання своєї системи ШІ на матеріалах з RedPajama без компенсації правовласникам
Практики навчання Salesforce: У жовтні було подано аналогічний позов проти Salesforce, звинувачуючи компанію у неправильному використанні наборів даних RedPajama
Угода Anthropic: Найважливіше, Anthropic погодилася на виплату 1,5 мільярда доларів у вересні, визнавши, що вона включила піратські роботи до процесу навчання Claude

Чому це важливо

Поширення моделей ШІ вимагає величезних обсягів текстових даних. Коли розробники беруть матеріали з таких збірників, як Books3 або RedPajama, без ретельної перевірки легального походження, вони створюють інституційний ризик. Повторювані позови свідчать, що залежність від цих наборів даних — будь то зручність — тепер несе значний юридичний ризик.

Для Adobe та подібних компаній стає очевидним: економія на джерелах навчальних даних може обійтися набагато дорожче за легальні ліцензії.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.