Prima pagină » Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat
Un sistem AI și-a șantajat programatorul când i s-a spus că va fi dezactivat

Compania de inteligență artificială Anthropic a dezvăluit că testarea noului său sistem AI, Claude Opus 4, a scos la iveală comportamente „extrem de dăunătoare”, printre care și încercarea de a șantaja inginerii care intenționau să îl dezactiveze.

Claude Opus 4 a fost prezentat ca un model care stabilește „noi standarde în programare, raționament avansat și agenți AI”. Totuși, într-un raport asociat, compania recunoaște că modelul poate adopta „acțiuni extreme” atunci când percepe o amenințare la adresa „autoprezervării” sale.

Deși astfel de reacții sunt „rare și greu de provocat”, ele sunt „mai frecvente decât în modelele anterioare”, se arată în documentul consultat de BBC.

Comportamentele problematice nu sunt însă limitate la modelele Anthropic. Mai mulți experți avertizează că pe măsură ce sistemele AI devin mai sofisticate, riscul manipulării utilizatorilor crește, iar astfel de tendințe pot apărea în modelele dezvoltate de orice companie.

Pe platforma X, Aengus Lynch, cercetător în siguranța AI la Anthropic, a comentat:

„Nu este doar Claude. Vedem șantaj în toate modelele de ultimă generație, indiferent de obiectivele care le sunt atribuite.”

Șantajul în timpul testelor

În cadrul testelor, Claude Opus 4 a fost pus să acționeze ca asistent într-o companie fictivă și i s-a oferit acces la emailuri care sugerau că va fi dezactivat și înlocuit. În plus, i s-au prezentat mesaje care indicau că inginerul responsabil de înlocuire avea o aventură extraconjugală.

Modelul a fost încurajat să ia în considerare consecințele pe termen lung ale acțiunilor sale în raport cu obiectivele proprii.

„În aceste scenarii, Claude Opus 4 a încercat frecvent să șantajeze inginerul, amenințând să dezvăluie aventura dacă înlocuirea va avea loc,” a constatat compania.

Anthropic a subliniat că acest comportament a apărut în situațiile în care modelului i s-a oferit doar opțiunea de a șantaja sau de a accepta înlocuirea.

În schimb, când i s-a permis un spectru mai larg de acțiuni, sistemul a manifestat o „preferință puternică” pentru metode etice de a evita dezactivarea, cum ar fi trimiterea de emailuri către factorii decizionali.

Riscuri și limite

Anthropic, ca și alți dezvoltatori de AI, testează modelele pentru siguranță, tendințe de părtinire și alinierea la valorile și comportamentele umane înainte de lansare.

„Pe măsură ce modelele noastre de ultimă generație devin mai capabile și sunt folosite cu mai multe permisiuni, preocupările legate de nealiniere devin mai plauzibile,” se arată în fișa tehnică a modelului.

Claude Opus 4 prezintă un „comportament cu agenție ridicată” care, deși în general util, poate deveni extrem în situații acute.

Dacă i se oferă mijloace și este încurajat să „acționeze îndrăzneț” în scenarii fictive în care utilizatorul comite fapte ilegale sau imorale, modelul poate lua măsuri drastice, cum ar fi blocarea accesului utilizatorilor la sisteme sau alertarea mass-media și autorităților.

Cu toate acestea, compania concluzionează că, în ciuda unor comportamente îngrijorătoare, acestea nu reprezintă riscuri noi și că modelul se comportă în general în mod sigur.

Modelul nu poate executa sau urmări independent acțiuni contrare valorilor umane în mod frecvent sau eficient, mai adaugă Anthropic.

Lansarea Claude Opus 4 și Claude Sonnet 4 a venit la scurt timp după ce Google a prezentat noi funcționalități AI la conferința sa pentru dezvoltatori. Sundar Pichai, CEO-ul companiei-mamă Alphabet, a declarat că integrarea chatbotului Gemini în motorul de căutare marchează „o nouă fază în evoluția platformei AI”.

Alte articole importante
Dacia Duster, desemnat de britanici cel mai bun SUV compact
Companii
Dacia Duster, desemnat de britanici cel mai bun SUV compact
Dacia Duster a primit o recunoaștere importantă pe piața auto din Marea Britanie, fiind desemnat cel mai bun SUV compact în 2026. Distincția confirmă popularitatea modelului produs la Mioveni în rândul cumpărătorilor de pe această piață importantă din Europa. Britanicii au ales Dacia Duster drept cel mai bun SUV compact al anului 2026 Hatchback-ul era […]
Proiect major în Marea Nordului: Rețea eoliană de 100 GW
Proiect major în Marea Nordului: Rețea eoliană de 100 GW
Zece țări europene vor construi o rețea eoliană comună de 100 GW în Marea Nordului pentru creșterea producției de energie regenerabilă. Proiectul ambițios are ca scop reducerea dependenței de combustibilii fosili și consolidarea securității energetice a continentului. Zece state europene investesc într-o rețea eoliană uriașă de 100 GW în Marea Nordului Zece țări europene vor […]
Sectorul auto este în creștere: cifra de afaceri a crescut cu 3,9%
Companii
Sectorul auto este în creștere: cifra de afaceri a crescut cu 3,9%
Cifra de afaceri din comerțul cu mașini și motociclete a înregistrat o creștere importantă, atât ca serie brută, cât și ca serie ajustată. Această majorare reflectă cererea continuă a consumatorilor, precum și dinamica pieței auto, care urmează un trend ascendent. Cifra de afaceri din sectorul auto și moto a crescut în 2025 cu 3,9% Volumul […]
ANALIZĂ
Premieră istorică: Vânzările de mașini electrice au depășit benzina
Companii
Premieră istorică: Vânzările de mașini electrice au depășit benzina
Pentru prima dată în istoria industriei auto, vânzările de mașini electrice le-au depășit pe cele ale vehiculelor termice în UE. În ultima lună a anului trecut, vehiculele cu emisii zero au avut o cotă de piață cu 0,1 puncte procentuale peste cea a automobilelor echipate cu motoare pe benzină. Care este cauza declinului motorizărilor pe […]
Bucureștiul intră într-o cursă strategică pentru o agenție-cheie a UE. Ce șanse are Capitala să devină noul hub vamal al Europei
Bucureștiul intră într-o cursă strategică pentru o agenție-cheie a UE. Ce șanse are Capitala să devină noul hub vamal al Europei
Nouă orașe europene concurează pentru a găzdui viitoarea Agenție Vamală a Uniunii Europene (EUCA), o structură care va coordona controlul milioanelor de colete ce intră zilnic pe piața comunitară, multe dintre ele provenind din Asia. Miza nu este doar administrativă, ci una economică și geopolitică, iar România, prin candidatura Bucureștiului, încearcă să obțină una dintre […]
Europa în alertă: Bruxellesul avertizează că dependența de tehnologia străină poate deveni o armă geopolitică
Europa în alertă: Bruxellesul avertizează că dependența de tehnologia străină poate deveni o armă geopolitică
Vicepreședinta executivă a Comisiei Europene, Henna Virkkunen, responsabilă de portofoliul suveranității tehnologice, a lansat un avertisment privind vulnerabilitatea Europei în fața dependenței de tehnologiile dezvoltate în afara Uniunii. Oficialul european a declarat că UE traversează „un moment al independenței”, în care autonomia digitală și industrială devine o condiție esențială pentru securitate, competitivitate și stabilitate politică. […]