Unul dintre cele mai mari scandaluri din industria tehnologiei scoate la iveală costul uriaș al abaterilor legale, iar pirateria literară devine acum subiectul central. Compania de inteligență artificială Anthropic a acceptat plata a 1,5 miliarde de dolari pentru a soluționa un proces colectiv intentat de autori. Aceștia acuză compania că a folosit copii piratate ale lucrărilor lor pentru antrenarea chatbotului, scrie TheGuardian.
În cazul în care un judecător aprobă înțelegerea, acest acord ar putea marca o premieră în disputa dintre firmele AI și creatorii de conținut. Scriitorii, artiștii vizuali și alți profesioniști din domeniul creativ acuză compania de încălcarea drepturilor de autor.
Anthropic s-a angajat să plătească aproximativ 3.000 de dolari pentru fiecare dintre cele 500.000 de cărți estimate încheiate de acord.
Justin Nelson, avocat al autorilor, a spus:
„Cât putem noi estima, aceasta este cea mai mare recuperare de drepturi de autor din istorie. Este prima de acest fel în era AI.”
Procesul a fost inițiat anul trecut de trei autori: Andrea Bartz, scriitoare de thriller, și autorii de non-ficțiune Charles Graeber și Kirk Wallace Johnson. Ei reprezintă acum o categorie mai largă de scriitori și edituri cărora li s-au descărcat cărțile pentru antrenarea chatbotului Claude.
Un judecător federal a emis o decizie mixtă în iunie, stabilind că antrenarea chatboturilor AI cu materiale protejate prin drepturi de autor nu este ilegală. Totuși, a constatat că Anthropic a obținut greșit milioane de cărți prin site-uri de piraterie.
Specialiștii susțin că, dacă procesul nu ar fi fost soluționat, pierderea în urma unui proces programat în decembrie ar fi putut aduce companiei din San Francisco pierderi mult mai mari.
William Long, analist juridic la Wolters Kluwer, a afirmat că „se întrezărea o posibilitate serioasă de pierderi de miliarde de dolari, suficiente pentru a destabiliza sau chiar a falimenta Anthropic.”
Judecătorul districtual William Alsup din San Francisco a programat o ședință luni pentru a examina termenii înțelegerii.
Cărțile sunt surse importante de date, oferind miliarde de cuvinte esențiale pentru modelele lingvistice ce stau la baza chatboturilor ca Claude și rivalul său principal, ChatGPT, creat de OpenAI.
În hotărârea sa din iunie, Alsup a menționat că Anthropic a descărcat peste 7 milioane de cărți digitalizate despre care „știa că au fost piratate.” Acesta a început cu aproape 200.000 de cărți de pe biblioteca online Books3, creată de cercetători AI independenți pentru a completa colecțiile pe care ChatGPT a fost antrenat.
Printre cărțile descărcate s-a numărat și romanul de debut thriller The Lost Night, scris de Andrea Bartz, una dintre autoarele reclamației.
Ulterior, Anthropic a preluat cel puțin 5 milioane de exemplare de pe site-ul pirat Library Genesis (LibGen) și cel puțin 2 milioane de copiii de pe Pirate Library Mirror, a notat judecătorul Alsup.
Guilda Autorilor le-a comunicat membrilor săi că se așteaptă la o despăgubire minimă de 750 de dolari pe carte, care ar putea fi mult mai mare dacă instanța găsește dovada unei încălcări cu bună știință. Suma mai mare din acord, de circa 3.000 de dolari pe lucrare, reflectă probabil o selecție restrânsă a cărților afectate, excluzând duplicatele și volumele fără drepturi de autor.
Mary Rasenberger, director general al Guild of Authors, a apreciat înțelegerea:
„Este un rezultat excelent pentru autori, edituri și titularii de drepturi, trimițând un mesaj clar industriei AI că există consecințe serioase când se piratează lucrările autorilor pentru antrenarea inteligenței artificiale, furt care afectează pe cei mai vulnerabili.”