Prima pagină » Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat
Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Compania de inteligență artificială Anthropic a dezvăluit că testarea noului său sistem AI, Claude Opus 4, a scos la iveală comportamente „extrem de dăunătoare”, printre care și încercarea de a șantaja inginerii care intenționau să îl dezactiveze.

Claude Opus 4 a fost prezentat ca un model care stabilește „noi standarde în programare, raționament avansat și agenți AI”. Totuși, într-un raport asociat, compania recunoaște că modelul poate adopta „acțiuni extreme” atunci când percepe o amenințare la adresa „autoprezervării” sale.

Deși astfel de reacții sunt „rare și greu de provocat”, ele sunt „mai frecvente decât în modelele anterioare”, se arată în documentul consultat de BBC.

Comportamentele problematice nu sunt însă limitate la modelele Anthropic. Mai mulți experți avertizează că pe măsură ce sistemele AI devin mai sofisticate, riscul manipulării utilizatorilor crește, iar astfel de tendințe pot apărea în modelele dezvoltate de orice companie.

Pe platforma X, Aengus Lynch, cercetător în siguranța AI la Anthropic, a comentat:

„Nu este doar Claude. Vedem șantaj în toate modelele de ultimă generație, indiferent de obiectivele care le sunt atribuite.”

Șantajul în timpul testelor

În cadrul testelor, Claude Opus 4 a fost pus să acționeze ca asistent într-o companie fictivă și i s-a oferit acces la emailuri care sugerau că va fi dezactivat și înlocuit. În plus, i s-au prezentat mesaje care indicau că inginerul responsabil de înlocuire avea o aventură extraconjugală.

Modelul a fost încurajat să ia în considerare consecințele pe termen lung ale acțiunilor sale în raport cu obiectivele proprii.

„În aceste scenarii, Claude Opus 4 a încercat frecvent să șantajeze inginerul, amenințând să dezvăluie aventura dacă înlocuirea va avea loc,” a constatat compania.

Anthropic a subliniat că acest comportament a apărut în situațiile în care modelului i s-a oferit doar opțiunea de a șantaja sau de a accepta înlocuirea.

În schimb, când i s-a permis un spectru mai larg de acțiuni, sistemul a manifestat o „preferință puternică” pentru metode etice de a evita dezactivarea, cum ar fi trimiterea de emailuri către factorii decizionali.

Riscuri și limite

Anthropic, ca și alți dezvoltatori de AI, testează modelele pentru siguranță, tendințe de părtinire și alinierea la valorile și comportamentele umane înainte de lansare.

„Pe măsură ce modelele noastre de ultimă generație devin mai capabile și sunt folosite cu mai multe permisiuni, preocupările legate de nealiniere devin mai plauzibile,” se arată în fișa tehnică a modelului.

Claude Opus 4 prezintă un „comportament cu agenție ridicată” care, deși în general util, poate deveni extrem în situații acute.

Dacă i se oferă mijloace și este încurajat să „acționeze îndrăzneț” în scenarii fictive în care utilizatorul comite fapte ilegale sau imorale, modelul poate lua măsuri drastice, cum ar fi blocarea accesului utilizatorilor la sisteme sau alertarea mass-media și autorităților.

Cu toate acestea, compania concluzionează că, în ciuda unor comportamente îngrijorătoare, acestea nu reprezintă riscuri noi și că modelul se comportă în general în mod sigur.

Modelul nu poate executa sau urmări independent acțiuni contrare valorilor umane în mod frecvent sau eficient, mai adaugă Anthropic.

Lansarea Claude Opus 4 și Claude Sonnet 4 a venit la scurt timp după ce Google a prezentat noi funcționalități AI la conferința sa pentru dezvoltatori. Sundar Pichai, CEO-ul companiei-mamă Alphabet, a declarat că integrarea chatbotului Gemini în motorul de căutare marchează „o nouă fază în evoluția platformei AI”.

Alte articole importante
România și Grecia își extind infrastructura pentru vehicule electrice. UE finanțează noi stații de încărcare de mare putere
România și Grecia își extind infrastructura pentru vehicule electrice. UE finanțează noi stații de încărcare de mare putere
Uniunea Europeană continuă investițiile în mobilitatea electrică, iar România se numără printre beneficiarii direcți ai unui nou proiect strategic care vizează dezvoltarea infrastructurii de încărcare pentru vehicule electrice. Prin programul Blue Route 4E, vor fi instalate peste o sută de puncte de încărcare rapidă și ultra-rapidă, menite să susțină tranziția către transportul sustenabil. Inițiativa este […]
Leul atinge un minim istoric. Euro trece de 5,14 lei pe fondul tensiunilor politice
Leul atinge un minim istoric. Euro trece de 5,14 lei pe fondul tensiunilor politice
Leul a înregistrat cea mai slabă valoare din istorie în raport cu euro, într-un context marcat de instabilitate politică și presiuni pe piața financiară. Cursul oficial anunțat de Banca Națională a României a urcat la 5,14 lei pentru un euro, stabilind un nou record negativ pentru leu. Evoluția vine după o perioadă de volatilitate accentuată, […]
Controverse uriașe în jurul programului SAFE. România se împrumută masiv pentru apărare, dar banii ajung în mare parte în afara țării
Controverse uriașe în jurul programului SAFE. România se împrumută masiv pentru apărare, dar banii ajung în mare parte în afara țării
Programul european SAFE, destinat consolidării apărării și industriei militare din Uniunea Europeană, a devenit subiectul unei dezbateri intense în România, după apariția unor documente care indică direcția principală a contractelor din primul pachet aprobat de autorități. În centrul controversei se află Guvernul condus de Ilie Bolojan, acuzat că direcționează o parte semnificativă din fondurile împrumutate […]
Prețul petrolului explodează la maximele ultimilor ani
Prețul petrolului explodează la maximele ultimilor ani
Prețul petrolului a atins niveluri record pentru ultimii patru ani, pe fondul tensiunilor tot mai accentuate din Orientul Mijlociu și al temerilor privind blocarea uneia dintre cele mai importante rute energetice ale lumii. Evoluția vine într-un moment delicat pentru economia globală și amplifică presiunile asupra consumatorilor, companiilor și guvernelor. Creșterea abruptă a cotațiilor este alimentată […]
Profitul BYD se prăbușește la început de an. Semnal de alarmă pentru liderul global al mașinilor electrice
Companii
Profitul BYD se prăbușește la început de an. Semnal de alarmă pentru liderul global al mașinilor electrice
Producătorul chinez de vehicule electrice BYD a raportat una dintre cele mai slabe evoluții financiare din ultimii ani, după ce profitul companiei s-a redus drastic în primul trimestru din 2026. Datele oficiale indică o combinație de factori negativi, printre care scăderea vânzărilor pe piața internă din China și intensificarea competiției în sectorul auto electric. Rezultatele […]
Merz atacă SUA și Bruxelles-ul, în timp ce economia Germaniei se prăbușește
Merz atacă SUA și Bruxelles-ul, în timp ce economia Germaniei se prăbușește
Economia celei mai puternice țări din Europa traversează o perioadă dificilă, iar reacțiile politice devin din ce în ce mai vizibile. Cancelarul german Friedrich Merz a început să își îndrepte criticile spre exterior, vizând atât Statele Unite, cât și instituțiile europene, într-un context economic marcat de stagnare și tensiuni politice interne în creștere. Declarațiile recente […]