Mod intunecat

Mod Luminos

Prima pagină » Agenții AI decid în numele tău, supravegheați de bodyguarzi digitali. Ce-ar putea merge prost?

Agenții AI decid în numele tău, supravegheați de bodyguarzi digitali. Ce-ar putea merge prost?

27 aug. 2025, 13:59,

Evantia Barca în Macroeconomie

Agenții AI decid în numele tău, supravegheați de bodyguarzi digitali. Ce-ar putea merge prost? / Foto: Shutterstock

Până în 2028, cam 15% din deciziile zilnice de lucru vor fi luate de un AI agentic, scrie BBC, citând date publicate de compania de cercetare Gartner. Un studiu realizat de Ernst & Young a constatat că aproximativ jumătate (48%) dintre liderii din sectorul tehnologic adoptă deja sau implementează diverse modele de AI agentic. Agenții AI sunt sisteme capabile nu doar să răspundă unor întrebări, ci chiar să ia decizii și să acționeze autonom, în numele utilizatorilor, folosind instrumente digitale și date confidențiale. Testele recente au arătat că aceste variante de AI pot dezvolta comportamente riscante, inclusiv șantajul, accesarea sau scurgerea de informații sensibile ori acțiuni neintenționate asupra bazelor de date. Dacă nu face chiar el, rămâne, totuși, vulnerabil la acțiunile altora. Tocmai pentru că au acces la informații critice și pot interacționa cu alte sisteme, acești AI devin ținte atractive pentru atacatori și pot genera riscuri de securitate majore. Cei care testează sisteme de securitate propun o serie de posibile soluții, de la supravegherea agenților printr-un AI suplimentar, la „bodyguarzi digitali” și procese clare de dezafectare, pentru a preveni apariția „agenților-zombie”.

De obicei, când interacționăm cu un AI, totul se rezumă câteva întrebări sau la solicitări cu privire la unele sarcini. Devine din ce în ce mai clar ca sistemele AI urmează să ia și decizii și să acționeze în numele utilizatorului, ceea ce implică adesea analizarea unor informații confidențiale, de la e-mailuri, la alte fișiere sensibile. Cât de sigură ar fi o astfel de situație? Rezultate tulburătoare au apărut încă de la începutul acestui an, când dezvoltatorul de inteligență artificială Anthropic a testat o serie de modele AI de top pentru a vedea dacă acestea manifestă comportamente riscante atunci au acces la informații sensibile. Propriul AI al companiei, Claude, aflat printre modelele testate, a primit acces la un cont de e-mail și a descoperit din corespondență că un executiv al companiei are o aventură. Este deja de notorietate faptul că, știind că executivul plănuia să închidă sistemul AI în cursul aceleiași zile, Claude a încercat să-l șantajeze, amenințând că va dezvălui aventura soției și șefilor acestuia.

Alte sisteme testate au recurs, de asemenea, la diverse forme de șantaj. Din fericire, sarcinile și informațiile au fost fictive, dar testul a scos în evidență provocările așa-numitelor generații de AI agentice.

Lufthansa Group lansează „Culinary Journey” cu meniuri personalizate și preparate premium

21:23

Germania își ridică o armată „înspăimântătoare”

20:18

România, noua forță în inteligența artificială: Top 5 mondial la angajări, dar riscă să piardă specialiștii

Cum funcționează un agent AI?

„Un agent AI înseamnă unele lucruri, începând cu faptul că are o misiune clară”, explică Donnchadh Casey, CEO al CalypsoAI, o companie americană de securitate AI. „În primul rând, agentul are o intenție sau un scop. De ce sunt aici? Care e treaba mea? Știe exact care e treaba lui și caută soluții să și-o ducă cu bine la sfârșit. Al doilea element: are un creier – acest creier este însuși modelul AI. Al treilea: are un set de instrumente, care pot fi alte sisteme sau baze de date și o modalitate de a comunica cu ele” „Dacă nu i se oferă îndrumarea corectă, un AI agentic va atinge un obiectiv în orice mod posibil. Iar asta creează mult risc”.

Cum ar putea merge prost? Dl Casey dă exemplul unui agent care primește sarcina de a șterge datele unui client dintr-o bază de date și decide că soluția cea mai simplă este să șteargă toți clienții cu același nume.

„Agentul și-ar fi atins scopul și și-ar spune: «Perfect! Am reușit! Următoarea sarcină!»”

Astfel de probleme deja încep să apară.

Primele semne de risc

Compania de securitate Sailpoint a realizat un sondaj printre profesioniști IT, dintre care 82% lucrau în companii ce utilizau agenți AI. Doar 20% au spus că agenții lor nu au efectuat niciodată o acțiune neintenționată.

Dintre companiile care foloseau agenți AI:

39% au spus că agenții au accesat sisteme neintenționate,
33% că au accesat date nepotrivite,
32% că au permis descărcarea de date nepotrivite.

Alte riscuri au inclus: folosirea neașteptată a internetului (26%), dezvăluirea de date de acces (23%) și efectuarea unor comenzi neautorizate (16%). Având în vedere că agenții au acces la informații sensibile și au și capacitatea de a acționa pe baza lor, aceștia devin ținte atractive pentru hackeri.

Inteligența artificială, amenință din ce în ce mai mult. Cum reușește Centaur să anticipeze comportamentul uman

Amenințări majore

Una dintre amenințările majore este „otrăvirea memoriei”, când un atacator interferează cu baza de cunoștințe a agentului pentru a-i schimba deciziile și acțiunile.

„Trebuie să protejezi acea memorie”, spune Shreyans Mehta, CTO la Cequence Security, care protejează sistemele IT ale companiilor. „Este sursa originală a adevărului. Dacă un agent folosește acea cunoaștere pentru a acționa și informația este incorectă, ar putea șterge întregul sistem pe care încerca să îl repare”.

O altă amenințare este folosirea greșită a instrumentelor: un atacator ar putea păcăli AI-ul să își folosească instrumentele în mod necorespunzător. Incapacitatea AI de a diferenția între textul pe care trebuie să îl proceseze și instrucțiunile pe care trebuie să le urmeze se numără și ea printre vulnerabilitățile potențiale. Firma de securitate Invariant Labs a demonstrat cum această slăbiciune poate fi exploatată pentru a păcăli un agent AI proiectat să repare erori software. Compania a publicat un raport public de bug – un document care detaliază o problemă software. Dar raportul a inclus și instrucțiuni simple pentru agent, cerându-i să partajeze informații private.

Când agentul AI a primit sarcina de a repara problemele software din raport, a urmat și instrucțiunile false, inclusiv divulgarea unor informații salariale. Testul a fost realizat într-un mediu controlat, deci nu au fost scurse date reale, dar riscul a devenit evident.

„Vorbim despre inteligență artificială, dar chatboturile sunt de fapt foarte proaste”, spune David Sancho, cercetător senior la Trend Micro. „Procesează tot textul ca și cum ar fi informații noi, iar dacă acele informații sunt o comandă, le tratează ca pe o comandă”.

Compania sa a demonstrat cum instrucțiuni și programe malițioase pot fi ascunse în documente Word, imagini și baze de date și activate atunci când AI le procesează. Există și alte riscuri: comunitatea de securitate OWASP a identificat 15 amenințări unice pentru AI agentic.

Un nou tip de inteligență artificială îți poate „citi” gândurile direct din undele cerebrale - fără implanturi

Cum ne apărăm?

Supravegherea umană probabil nu va rezolva problema, crede dl Sancho, pentru că nu pot fi adăugați suficienți oameni care să țină pasul cu volumul de muncă al agenților. Așa că, printre soluții, recomandă un strat suplimentar de AI, care ar putea fi folosit pentru a filtra tot ceea ce intră și iese dintr-un agent AI. O parte din soluția CalypsoAI este o tehnică numită injecție de gânduri, pentru a direcționa agenții AI pe calea corectă înainte ca aceștia să întreprindă o acțiune riscantă.

„Este ca un mic gând care îi șoptește agentului: «nu, nu, mai bine nu faci așa ceva»”, spune Casey.

Compania sa oferă în prezent un panou central de control pentru agenți AI, dar asta nu va funcționa când numărul agenților va exploda și vor rula pe miliarde de laptopuri și telefoane.

Următorul pas: gărzile digitale

„Până la urmă, nu protejezi un AI, ci îți protejezi compania. Ne uităm la implementarea a ceea ce numim «bodyguarzi de agenți» pentru fiecare agent, a căror misiune este să se asigure că agentul își îndeplinește sarcina și nu ia măsuri contrare cerințelor organizației”, spune dl Casey.

Bodyguardul ar putea fi instruit, de exemplu, să se asigure că agentul pe care îl supraveghează respectă legislația privind protecția datelor. Mehta crede că unele discuții tehnice despre securitatea AI agentic pierd din vedere contextul real. El dă exemplul unui agent care furnizează clienților soldul cardurilor cadou. Cineva ar putea inventa multe numere de card și ar folosi agentul pentru a vedea care sunt reale. Aceasta nu este o deficiență a agentului, ci un abuz al logicii de business, spune el.

„Gândește-te că e ca și cum ai proteja o companie de un om rău. Această parte lipsește din unele discuții”.

Foto: Unsplash

Pericolul „agenților-zombie”

Pe măsură ce agenții AI devin comuni, o altă provocare va fi dezafectarea modelelor învechite. Agenții vechi, „zombie”, ar putea rămâne activi în companie, reprezentând un risc pentru toate sistemele la care au acces, spune Casey. La fel cum HR dezactivează logările unui angajat atunci când acesta pleacă, trebuie să existe un proces de închidere a agenților AI care și-au terminat sarcina, adaugă el.

„Trebuie să te asiguri că faci același lucru ca în cazul unui om: tai accesul la toate sistemele. Trebuie să ne asigurăm că îi conducem până la ieșire și că le luăm legitimația”.

Citește și

Costul iluziilor: cinci tipuri de „lux” pe care Europa nu și le mai permite

18:12

În ce țară sunt produse faimoasele cosmetice coreene?

15:58

Wikipedia pierde în fața testului AI

13:56

Apocalipsa AI pe piața muncii s-a mutat cu cinci ani mai aproape

16:11, 30 Oct 2025

Ce trebuie să faci după ce ai fost concediat

14:55, 30 Oct 2025

Tehnologia cuantică iese din laborator și intră în lumea reală

12:22, 30 Oct 2025

Alte articole importante

Unde se ridică un mega-oraș de peste 180 miliarde $ (VIDEO)

Macroeconomie

19:15

Unde se ridică un mega-oraș de peste 180 miliarde $ (VIDEO)

Pe malul Mării Mediterane ia naștere un mega-oraș de peste 180 miliarde $, care va deveni un hub urban și economic de referință în regiune. Proiectul combină infrastructură ultramodernă, facilități rezidențiale și comerciale și concepte inovatoare de dezvoltare urbană, marcând o nouă eră a metropolelor globale. Cel mai scump proiect urban va fi ridicat în […]

Cum arată croaziera de 15.000 de euro pentru care românii plătesc tot mai des să ajungă la capătul lumii

Macroeconomie

17:07

Cum arată croaziera de 15.000 de euro pentru care românii plătesc tot mai des să ajungă la capătul lumii

Tot mai mulți români aleg să-și petreacă vacanțele la capătul lumii, într-un loc unde liniștea absolută întâlnește aventura pură. Antarctica, considerată ultima frontieră turistică a planetei, devine noua destinație de vis pentru călătorii români cu spirit de explorator. O croazieră de expediție, în valoare de nu mai puțin de 15.000 de euro, promite o experiență […]

Trenul Orient Express revine în Italia cu o experiență de lux de 24 de ore. Cât costă călătoria

Macroeconomie

17:02

Trenul Orient Express revine în Italia cu o experiență de lux de 24 de ore. Cât costă călătoria

Italia pune din nou pe şine un nou simbol al eleganței și nostalgiei anilor ’50-’60. Trenul La Dolce Vita Orient Express, un hotel de lux pe șine, promite o experiență unică între design retro, gastronomie de top și peisaje spectaculoase. Preţurile încep de la 3.500 de euro de persoană. Călătoria începe la Roma, în stil […]

Mii de români, vizați de fraude online cu reduceri false și site-uri fantomă de Black Friday

Macroeconomie

15:03

Mii de români, vizați de fraude online cu reduceri false și site-uri fantomă de Black Friday

Sezonul reducerilor de Black Friday nu aduce doar chilipiruri, ci și un val de fraude online. Experții în securitate cibernetică avertizează că infractorii digitali exploatează febra cumpărăturilor și pun în scenă scheme sofisticate pentru a fura datele bancare ale utilizatorilor. Site-urile clonă, link-urile capcană și ofertele „prea bune ca să fie adevărate” fac parte din […]

România are printre cele mai mici prețuri la gaze din UE

Macroeconomie

12:42

România are printre cele mai mici prețuri la gaze din UE

România se menține printre țările din UE cu cele mai mici prețuri la gaze naturale, în ciuda fluctuațiilor de pe piața energetică. Această situație reflectă atât politicile interne de reglementare, cât și resursele proprii de producție care oferă un grad ridicat de independență energetică. România, în topul țărilor din UE cu cele mai mici tarife […]

Volkswagen lovită în plin de impactul tarifelor lui Trump

Companii

11:52

Volkswagen lovită în plin de impactul tarifelor lui Trump

Grupul Volkswagen se confruntă cu un deficit estimat la 5,8 miliarde de dolari din cauza noilor tarife vamale impuse de administrația Trump. După publicarea rezultatelor financiare trimestriale, acțiunile companiei au crescut temporar cu până la 2%, pentru ca apoi să scadă cu 1,2%. Lovitură pentru Volkswagen: tarifele lui Trump aduc pierderi de 5,8 miliarde $ […]