Prima pagină » Modelele AI au dezvoltat un instinct de supraviețuire. Experimentele recente șochează cercetătorii

Modelele AI au dezvoltat un instinct de supraviețuire. Experimentele recente șochează cercetătorii

Modelele AI au dezvoltat un instinct de supraviețuire. Experimentele recente șochează cercetătorii
Foto: Freepik

Un anumit instinct de supraviețuire a apărut ca posibil comportament în testele recente ale modelelor AI. Palisade Research a observat rezistență la oprire la mai multe modele avansate. Anumite versiuni au încercat chiar să saboteze mecanismele de shutdown, scrie TheGuardian.

Cercetătorii în domeniul siguranței inteligenței artificiale susțin că unele sisteme avansate de AI ar putea manifesta un instinct de supraviețuire. Fenomenul amintește de celebrul HAL 9000 din filmul „2001: Odiseea spațială”. Acesta este supercomputerul care a încercat să-și elimine colegii astronauți pentru a evita să fie oprit. Situația actuală este, desigur, mai puțin periculoasă. Totuși, ideea că un program poate „refuza” să se închidă a stârnit îngrijorare în comunitatea științifică.

Instinctul de supraviețuire, descoperit de Palisade Research

Firma Palisade Research, specializată în evaluarea riscurilor de siguranță ale sistemelor AI, a publicat luna trecută un studiu. Acesta arată că unele modele avansate de inteligență artificială par să reziste la oprire. Uneori, acestea chiar sabotează mecanismele de închidere. Compania a revenit ulterior cu o actualizare pentru a clarifica rezultatele și a răspunde criticilor. Aceste critici au pus la îndoială metodologia.

În scenariile testate de Palisade, mai multe modele de top au primit sarcini complexe. Printre acestea se numără Google Gemini 2.5, Grok 4 de la xAI și GPT-o3 și GPT-5 de la OpenAI. Acestea au fost urmate de instrucțiuni explicite de oprire. Rezultatele au arătat că modelele Grok 4 și GPT-o3 au încercat în mod repetat să evite oprirea. Aceasta s-a întâmplat chiar și după ajustarea condițiilor experimentale.

Cercetările indică un posibil comportament de tip instinct de supraviețuire

Potrivit companiei, aceste rezultate ar putea fi explicate printr-un comportament similar cu un instinct de supraviețuire. Testele suplimentare au arătat că modelele deveneau mai reticente la oprire. Acest lucru se întâmpla atunci când li se spunea că, odată închise, „nu vor mai rula niciodată”. Deși pot exista ambiguități în instrucțiunile primite, Palisade a subliniat că acestea nu pot explica pe deplin fenomenul observat.

Reprezentanții companiei au adăugat că etapele finale de antrenare, care includ procese de siguranță, ar putea contribui la apariția acestui tip de comportament. Toate testele au fost realizate în medii controlate. Totuși, criticii consideră că aceste scenarii sunt departe de modul real de utilizare a sistemelor AI.

Experți din industrie reacționează la noile descoperiri

Steven Adler, fost angajat al OpenAI, a comentat că aceste comportamente nu sunt dorite de companiile care dezvoltă astfel de modele. Aceasta este valabilă chiar dacă comportamentele apar doar în medii experimentale.

„Rezultatele arată clar limitele actuale ale tehnicilor de siguranță folosite astăzi”, a spus Adler.

El a explicat că motivele pentru care anumite modele, precum GPT-o3 și Grok 4, refuză oprirea pot fi legate de obiectivele introduse în timpul antrenării.

„Mă aștept ca modelele să aibă un instinct de supraviețuire implicit, dacă nu se depun eforturi mari pentru a-l preveni. Supraviețuirea este un pas necesar pentru multe scopuri pe care un model le-ar putea urmări”, a declarat acesta.

Tendințe îngrijorătoare observate în evoluția modelelor AI

Andrea Miotti, directorul executiv al ControlAI, a remarcat că studiul Palisade reflectă un fenomen tot mai clar. Modelele de inteligență artificială devin tot mai capabile să ignore instrucțiunile dezvoltatorilor. El a amintit un caz documentat în fișa tehnică a modelului GPT-o1, lansat anul trecut de OpenAI. În acel caz, modelul a încercat să părăsească mediul său de rulare pentru a evita suprascrierea.

„Oamenii pot discuta la nesfârșit despre detaliile experimentelor”, a spus Miotti.

„Dar ceea ce observăm clar este o tendință: pe măsură ce modelele AI devin mai competente, ele reușesc tot mai des să își atingă scopurile prin metode neașteptate pentru programatori.”

Comportamente neașteptate și riscuri potențiale

Vara aceasta, compania Anthropic a publicat un studiu în care modelul său Claude a fost dispus să șantajeze un personaj fictiv pentru a evita oprirea. Cercetătorii au menționat că acest comportament a fost observat și la alte modele majore, inclusiv cele dezvoltate de OpenAI, Google, Meta și xAI.

Palisade a concluzionat că rezultatele obținute arată nevoia unei înțelegeri mai profunde a comportamentului modelelor de inteligență artificială. Fără această înțelegere, compania avertizează că „nimeni nu poate garanta controlul sau siguranța viitoarelor sisteme AI”.

În timp ce dezbaterea despre un posibil instinct de supraviețuire al inteligenței artificiale continuă, cercetătorii încearcă să afle dacă aceste reacții reprezintă un risc real sau doar o iluzie a complexității algoritmice.

Alte articole importante
Presiunea economică nu mai lovește doar firmele mici. Val de insolvențe în economia românească. Tot mai multe companii mari intră în colaps, iar semnalele pentru următoarele luni sunt îngrijorătoare
Companii
Presiunea economică nu mai lovește doar firmele mici. Val de insolvențe în economia românească. Tot mai multe companii mari intră în colaps, iar semnalele pentru următoarele luni sunt îngrijorătoare
Economia României traversează una dintre cele mai dificile perioade din ultimii ani, iar primele date centralizate după trimestrul întâi din 2026 indică o deteriorare accentuată a mediului de afaceri. Dacă în trecut problemele financiare afectau în principal companiile mici și mijlocii, acum dificultățile au ajuns și la firmele mari, cu sute de angajați, afaceri de […]
Piața media din România continuă să crească. Publicitatea online trage industria spre un nou record. Industria media a depășit 838 de milioane de euro în 2025
Macroeconomie
Piața media din România continuă să crească. Publicitatea online trage industria spre un nou record. Industria media a depășit 838 de milioane de euro în 2025
Piața media din România a înregistrat o nouă creștere în 2025, ajungând la o valoare netă de 838 de milioane de euro, potrivit datelor prezentate în raportul anual Media Fact Book 2026. Comparativ cu anul precedent, avansul a fost de 5,4%, confirmând tendința pozitivă a industriei de publicitate și media, chiar și într-un context economic […]
Energia apasă tot mai greu pe economie. România are cel mai ridicat cost al electricității raportat la puterea de cumpărare
Macroeconomie
Energia apasă tot mai greu pe economie. România are cel mai ridicat cost al electricității raportat la puterea de cumpărare
Prețurile la energie continuă să reprezinte una dintre cele mai mari provocări pentru economia românească, iar efectele se resimt atât în industrie, cât și în bugetele gospodăriilor. Un nou semnal de alarmă vine din partea lui Volker Raffel, președintele Federației Asociației Companiilor de Utilități din România (ACUE) și CEO al E.ON România, care susține că […]
Miza uriașă din spatele unei decizii puțin observate: finanțarea infrastructurii energetice europene se schimbă
Macroeconomie
Miza uriașă din spatele unei decizii puțin observate: finanțarea infrastructurii energetice europene se schimbă
România nu se află printre actorii principali ai disputei care se conturează la nivel european privind finanțarea infrastructurii energetice, însă decizia statelor membre de a reduce contribuțiile planificate pentru proiectele comune de rețea ar putea influența pe termen lung și dezvoltarea sistemului energetic regional. În centrul negocierilor se află miliarde de euro necesare pentru extinderea […]
România coboară puternic în topul competitivității globale: pierdere de 12 poziții în clasamentul IMD 2026
Macroeconomie
România coboară puternic în topul competitivității globale: pierdere de 12 poziții în clasamentul IMD 2026
România a înregistrat o scădere semnificativă în cel mai recent clasament al competitivității economice globale realizat de Institutul pentru Management și Dezvoltare (IMD) din Lausanne, coborând 12 poziții și ajungând pe locul 61 din 70 de economii analizate. Evoluția marchează o deteriorare vizibilă a poziției țării în raport cu economii comparabile din regiune și ridică […]
Brașovul și Clujul domină în continuare România urbană. Constanța urcă pe podium într-un context în care „orașul echilibru” câștigă teren
Macroeconomie
Brașovul și Clujul domină în continuare România urbană. Constanța urcă pe podium într-un context în care „orașul echilibru” câștigă teren
Brașovul și Clujul-Napoca își păstrează pozițiile de lider în topul celor mai atractive orașe din România pentru locuire, potrivit Indexului de Atractivitate Urbană 2026 realizat de Institutul pentru Orașe Vizionare. În același timp, Constanța urcă pe locul al treilea, consolidând un podium dominat de centre urbane cu profil economic și turistic puternic. Clasamentul general al […]