Expansi agresif Adobe ke kecerdasan buatan menghadapi kemunduran hukum yang signifikan. Perusahaan dituduh menggabungkan materi sastra bajakan ke dalam infrastruktur pembelajaran mesin mereka—langkah yang memicu gugatan class-action yang berfokus pada pelanggaran hak cipta.
Tuduhan Inti
Penulis Elizabeth Lyon dari Oregon telah mengajukan gugatan class-action yang mengklaim bahwa Adobe menggunakan salinan buku yang tidak sah, termasuk karya-karya yang dia tulis sendiri, sebagai bahan pelatihan untuk SlimLM, model bahasa khusus perusahaan yang dirancang untuk aplikasi pengolahan dokumen mobile. Menurut dokumen pengadilan, karya sastra ini diintegrasikan tanpa persetujuan atau kompensasi dari penulis.
Bagaimana Buku Bajakan Masuk ke Sistem Adobe
Jalur menuju penyalahgunaan yang diduga ini berawal dari SlimPajama-627B, sebuah dataset publik yang dibuat oleh Cerebras dan dirilis pada pertengahan 2023. Adobe mengandalkan dataset ini untuk pra-pelatihan SlimLM. Namun, gugatan mengungkapkan rantai masalah: SlimPajama sendiri berasal dari RedPajama dengan menggabungkan Books3—sebuah repositori besar yang berisi 191.000 karya yang diterbitkan.
Isu utama: Books3 dilaporkan mengandung materi berhak cipta yang dikumpulkan tanpa izin yang tepat. Ketika Adobe membangun di atas fondasi yang terkompromi ini, perusahaan diduga mewarisi pelanggaran hak cipta tersebut. Seperti yang dicatat tim hukum Lyon, SlimLM menjadi karya turunan yang mengandung konten sastra yang tidak sah.
Pola yang Muncul di Seluruh Industri
Adobe bukanlah perusahaan teknologi pertama yang menghadapi tuduhan seperti ini. Dataset dasar yang mendukung sistem AI modern telah menjadi ladang ranjau sengketa hak cipta:
Model Kecerdasan Apple: Pada September, Apple digugat karena diduga melatih sistem AI-nya menggunakan materi dari RedPajama tanpa memberi kompensasi kepada pemilik hak
Praktik Pelatihan Salesforce: Oktober menyaksikan litigasi serupa terhadap Salesforce, menuduh perusahaan menggunakan dataset RedPajama secara tidak tepat
Penyelesaian Anthropic: Yang paling signifikan, Anthropic menyetujui penyelesaian sebesar ,5 miliar dengan penulis pada September, mengakui bahwa mereka telah menggabungkan karya bajakan ke dalam jalur pelatihan Claude
Mengapa Ini Penting
Perkembangan model AI membutuhkan jumlah data teks yang sangat besar. Ketika pengembang mengambil dari kompilasi seperti Books3 atau RedPajama tanpa memeriksa asal-usul legalnya secara menyeluruh, mereka menciptakan risiko institusional. Gugatan berulang menunjukkan bahwa bergantung pada dataset ini—bagaimanapun juga—sekarang membawa risiko hukum yang besar.
Bagi Adobe dan perusahaan serupa, pesan yang semakin tak terbantahkan adalah: mengabaikan sumber data pelatihan bisa jauh lebih mahal daripada mendapatkan lisensi yang sah.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Adobe Menghadapi Tantangan Hukum atas Penggunaan Tidak Sah Karya Penulis dalam Pengembangan Model AI
Expansi agresif Adobe ke kecerdasan buatan menghadapi kemunduran hukum yang signifikan. Perusahaan dituduh menggabungkan materi sastra bajakan ke dalam infrastruktur pembelajaran mesin mereka—langkah yang memicu gugatan class-action yang berfokus pada pelanggaran hak cipta.
Tuduhan Inti
Penulis Elizabeth Lyon dari Oregon telah mengajukan gugatan class-action yang mengklaim bahwa Adobe menggunakan salinan buku yang tidak sah, termasuk karya-karya yang dia tulis sendiri, sebagai bahan pelatihan untuk SlimLM, model bahasa khusus perusahaan yang dirancang untuk aplikasi pengolahan dokumen mobile. Menurut dokumen pengadilan, karya sastra ini diintegrasikan tanpa persetujuan atau kompensasi dari penulis.
Bagaimana Buku Bajakan Masuk ke Sistem Adobe
Jalur menuju penyalahgunaan yang diduga ini berawal dari SlimPajama-627B, sebuah dataset publik yang dibuat oleh Cerebras dan dirilis pada pertengahan 2023. Adobe mengandalkan dataset ini untuk pra-pelatihan SlimLM. Namun, gugatan mengungkapkan rantai masalah: SlimPajama sendiri berasal dari RedPajama dengan menggabungkan Books3—sebuah repositori besar yang berisi 191.000 karya yang diterbitkan.
Isu utama: Books3 dilaporkan mengandung materi berhak cipta yang dikumpulkan tanpa izin yang tepat. Ketika Adobe membangun di atas fondasi yang terkompromi ini, perusahaan diduga mewarisi pelanggaran hak cipta tersebut. Seperti yang dicatat tim hukum Lyon, SlimLM menjadi karya turunan yang mengandung konten sastra yang tidak sah.
Pola yang Muncul di Seluruh Industri
Adobe bukanlah perusahaan teknologi pertama yang menghadapi tuduhan seperti ini. Dataset dasar yang mendukung sistem AI modern telah menjadi ladang ranjau sengketa hak cipta:
Mengapa Ini Penting
Perkembangan model AI membutuhkan jumlah data teks yang sangat besar. Ketika pengembang mengambil dari kompilasi seperti Books3 atau RedPajama tanpa memeriksa asal-usul legalnya secara menyeluruh, mereka menciptakan risiko institusional. Gugatan berulang menunjukkan bahwa bergantung pada dataset ini—bagaimanapun juga—sekarang membawa risiko hukum yang besar.
Bagi Adobe dan perusahaan serupa, pesan yang semakin tak terbantahkan adalah: mengabaikan sumber data pelatihan bisa jauh lebih mahal daripada mendapatkan lisensi yang sah.