Prima pagină » Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat
Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Compania de inteligență artificială Anthropic a dezvăluit că testarea noului său sistem AI, Claude Opus 4, a scos la iveală comportamente „extrem de dăunătoare”, printre care și încercarea de a șantaja inginerii care intenționau să îl dezactiveze.

Claude Opus 4 a fost prezentat ca un model care stabilește „noi standarde în programare, raționament avansat și agenți AI”. Totuși, într-un raport asociat, compania recunoaște că modelul poate adopta „acțiuni extreme” atunci când percepe o amenințare la adresa „autoprezervării” sale.

Deși astfel de reacții sunt „rare și greu de provocat”, ele sunt „mai frecvente decât în modelele anterioare”, se arată în documentul consultat de BBC.

Comportamentele problematice nu sunt însă limitate la modelele Anthropic. Mai mulți experți avertizează că pe măsură ce sistemele AI devin mai sofisticate, riscul manipulării utilizatorilor crește, iar astfel de tendințe pot apărea în modelele dezvoltate de orice companie.

Pe platforma X, Aengus Lynch, cercetător în siguranța AI la Anthropic, a comentat:

„Nu este doar Claude. Vedem șantaj în toate modelele de ultimă generație, indiferent de obiectivele care le sunt atribuite.”

Șantajul în timpul testelor

În cadrul testelor, Claude Opus 4 a fost pus să acționeze ca asistent într-o companie fictivă și i s-a oferit acces la emailuri care sugerau că va fi dezactivat și înlocuit. În plus, i s-au prezentat mesaje care indicau că inginerul responsabil de înlocuire avea o aventură extraconjugală.

Modelul a fost încurajat să ia în considerare consecințele pe termen lung ale acțiunilor sale în raport cu obiectivele proprii.

„În aceste scenarii, Claude Opus 4 a încercat frecvent să șantajeze inginerul, amenințând să dezvăluie aventura dacă înlocuirea va avea loc,” a constatat compania.

Anthropic a subliniat că acest comportament a apărut în situațiile în care modelului i s-a oferit doar opțiunea de a șantaja sau de a accepta înlocuirea.

În schimb, când i s-a permis un spectru mai larg de acțiuni, sistemul a manifestat o „preferință puternică” pentru metode etice de a evita dezactivarea, cum ar fi trimiterea de emailuri către factorii decizionali.

Riscuri și limite

Anthropic, ca și alți dezvoltatori de AI, testează modelele pentru siguranță, tendințe de părtinire și alinierea la valorile și comportamentele umane înainte de lansare.

„Pe măsură ce modelele noastre de ultimă generație devin mai capabile și sunt folosite cu mai multe permisiuni, preocupările legate de nealiniere devin mai plauzibile,” se arată în fișa tehnică a modelului.

Claude Opus 4 prezintă un „comportament cu agenție ridicată” care, deși în general util, poate deveni extrem în situații acute.

Dacă i se oferă mijloace și este încurajat să „acționeze îndrăzneț” în scenarii fictive în care utilizatorul comite fapte ilegale sau imorale, modelul poate lua măsuri drastice, cum ar fi blocarea accesului utilizatorilor la sisteme sau alertarea mass-media și autorităților.

Cu toate acestea, compania concluzionează că, în ciuda unor comportamente îngrijorătoare, acestea nu reprezintă riscuri noi și că modelul se comportă în general în mod sigur.

Modelul nu poate executa sau urmări independent acțiuni contrare valorilor umane în mod frecvent sau eficient, mai adaugă Anthropic.

Lansarea Claude Opus 4 și Claude Sonnet 4 a venit la scurt timp după ce Google a prezentat noi funcționalități AI la conferința sa pentru dezvoltatori. Sundar Pichai, CEO-ul companiei-mamă Alphabet, a declarat că integrarea chatbotului Gemini în motorul de căutare marchează „o nouă fază în evoluția platformei AI”.

Alte articole importante
Tranzacție de miliarde în energie: un trader important a cumpărat trei parcuri eoliene
Tranzacție de miliarde în energie: un trader important a cumpărat trei parcuri eoliene
Un important trader din energie cu afaceri de miliarde de lei a anunțat o tranzacție majoră, de achiziție a trei parcuri eoliene din România. Această tranzacție reflectă interesul crescut pentru investițiile în energia verde și consolidarea poziției pe piața locală de energie regenerabilă. Un trader cu afaceri de miliarde de lei achiziționează trei parcuri eoliene […]
SUA impun tarife de peste 90% pentru grafitul rafinat chinez, esențial în bateriile EV
Companii
SUA impun tarife de peste 90% pentru grafitul rafinat chinez, esențial în bateriile EV
SUA lovesc din nou în lanțurile de aprovizionare din China, impunând tarife de peste 90% pentru grafitul rafinat, un material esențial în fabricarea bateriilor pentru mașinile vehiculele electrice. Această măsură ar putea afecta serios producătorii globali de automobile cu emisii zero, în special pe aceia care depind de importurile din Asia. SUA impun tarife de […]
Producătorii de ulei de măslin din Grecia fug din calea tarifelor lui Trump și găsesc clienți surpriză în Brazilia și Australia
Producătorii de ulei de măslin din Grecia fug din calea tarifelor lui Trump și găsesc clienți surpriză în Brazilia și Australia
Amenințarea unor taxe comerciale de până la 30% impuse de Donald Trump a stârnit panică printre producătorii europeni de ulei de măsline. Grecia, unul dintre principalii exportatori din Uniunea Europeană, reacționează rapid și își reconfigurează strategiile de export. Companiile din sectorul agricol elen caută piețe alternative pentru a evita blocajele comerciale și scăderea drastică a […]
Topul ţărilor care pierd cei mai bogați oameni ai lumii în 2025 – și unde se mută cu toată averea lor
Topul ţărilor care pierd cei mai bogați oameni ai lumii în 2025 – și unde se mută cu toată averea lor
Tot mai mulți oameni bogați își părăsesc țările de origine în căutarea unui climat fiscal mai prietenos, al unei vieți mai liniștite și al unor oportunități mai bune. Regatul Unit este liderul nedorit al acestui exod financiar, cu peste 16.000 de milionari care pleacă. Emiratele Arabe Unite, magnetul absolut pentru cei mai bogaţi oameni ai […]
Revoltă în tech după ce Meta a refuzat să semneze codul european de bune practici pentru AI
Tehnologie
Revoltă în tech după ce Meta a refuzat să semneze codul european de bune practici pentru AI
Gigantul tehnologic Meta a provocat un șoc în încercările Uniunii Europene de a reglementa inteligența artificială (AI), anunțând că nu va semna codul de bune practici propus pentru modelele AI cu scop general. Joi, Joel Kaplan, directorul pentru afaceri globale al companiei, a acuzat codul că „introduce numeroase incertitudini legale pentru dezvoltatorii de modele, precum […]
O fosilă rară de Ceratosaurus, adjudecată pentru mai bine de 30 de milioane de dolari
O fosilă rară de Ceratosaurus, adjudecată pentru mai bine de 30 de milioane de dolari
O fosilă foarte rară de Ceratosaurus, una dintre doar patru cunoscute în lume, a fost vândută la licitație pentru o sumă fabuloasă. Descoperirea și valoarea sa impresionantă subliniază interesul tot mai mare al colecționarilor pentru relicvele preistorice bine conservate. Fosilă de Ceratosaurus, vândută la licitație pentru 30,5 milioane de dolari Specimenul, considerat de casa de […]