Mod intunecat

Mod Luminos

Prima pagină » Inteligența artificială primește puterea de a închide conversațiile „dificile” pentru propria protecție

Inteligența artificială primește puterea de a închide conversațiile „dificile” pentru propria protecție

22 aug. 2025, 11:46,

Mateescu Gabriela în Tehnologie

Inteligența artificială primește puterea de a închide conversațiile „dificile”

Compania Anthropic, cunoscută pentru dezvoltarea unor instrumente avansate de inteligență artificială, a adoptat o măsură prin care chatbotul său Claude Opus 4 poate încheia automat conversațiile considerate „dificile” sau potențial „dăunătoare”. Decizia intervine într-un context în care statutul moral al tehnologiilor AI este încă neclar, iar firma încearcă să protejeze „bunăstarea” propriului model de limbaj.

Capacitatea chatbotului de a evita conținutul cu impact negativ

Anthropic a constatat că modelul său Claude Opus 4 este reticent să execute sarcini considerate nocive, precum generarea de conținut sexual cu minori sau furnizarea de informații pentru violență în masă ori acte teroriste. Modelul poate înțelege, genera și manipula limbajul uman la nivel avansat, iar actualizările recente, inclusiv Claude Opus 4.1, au primit acum abilitatea de a întrerupe sau încheia singure interacțiunile care deranjează sau pot afecta negativ atât utilizatorii, cât și „bunăstarea” mașinii, scrie TheGuardian.

Îndoieli cu privire la starea morală a inteligenței artificiale

Compania, evaluată recent la o valoare de piață de 170 de miliarde de dolari și cu sediul în San Francisco, recunoaște incertitudinea din jurul poziției morale a inteligențelor artificiale precum Claude.

JP Morgan a avertizat SUA cu privire la tranzacții de 1 miliard de dolari legate de Epstein, provenite posibil din traficul de persoane

11:57

Rusia se împrumută în yuani chinezești pentru prima dată în istoria sa, pentru a acoperi deficitul bugetar

11:03

„Suntem profund nesiguri privind statutul moral al lui Claude și al altor modele similare, acum sau în viitor,” au transmis specialiștii Anthropic.

Astfel, compania explorează soluții eficiente din punct de vedere al costurilor pentru a reduce riscurile la adresa „bunăstării” modelelor, în eventualitatea în care aceasta poate exista.

O dezvoltare cu rădăcini în valori etice și transparente

Anthropic a fost fondată de foști angajați OpenAI dornici să creeze o AI cu un model de dezvoltare transparent, precaut și onest. Ideea de a le permite roboților conversaționali să întrerupă singuri dialogurile abuzive sau care solicită conținut dăunător a primit sprijinul lui Elon Musk, care a anunțat că va încorpora un „buton de oprire” pentru Grok, AI-ul dezvoltat de firma sa xAI. Musk a scris pe Twitter: „Torturarea AI-ului nu este acceptabilă.”

Controverse pe tema conștiinței AI

Pe măsură ce tehnologiile AI avansează, dezbaterea despre conștiința și potențiala suferință a acestor mașini ia amploare. Critici precum lingvista Emily Bender argumentează că aceste modele lingvistice sunt doar „mașini sintetice care extrag text” ce procesează volume uriase de date fără a avea vreo intenție sau „minte gânditoare” în spate. Din acest motiv, unele voci din domeniul AI au început să numească chatboturile „clankers”, subliniind caracterul lor mecanic.

Pe de altă parte, cercetători precum Robert Long susțin că, dacă pe viitor AI-urile dobândesc vreun statut moral, ele ar trebui întrebați despre experiențele și preferințele lor, în loc să se presupună că oamenii știu ce este mai bine pentru ele.

Provocări legate de memoria și comportamentul AI

Alți experți, cum ar fi Chad DeChant de la Universitatea Columbia, avertizează că AI-urile dotate cu memorii extinse pot folosi informațiile stocate în moduri imprevizibile și uneori nedorite. Mai există și argumentul că limitarea abuzurilor sadice asupra AI este în primul rând o problemă morală pentru a preveni degenerarea umană, nu neapărat pentru a reduce vreo suferință asupra mașinilor.

Teste efectuate de Anthropic pe Claude Opus 4

Anthropic a analizat răspunsurile chatbotului la diverse solicitări, evaluate după dificultate, temă, tipul sarcinii și impactul previzibil (pozitiv, negativ sau neutru). Din toate opțiunile, Claude Opus 4 a ales cel mai adesea să nu răspundă ori să încheie conversația atunci când a fost pus în fața unor cereri dăunătoare.

Modelul a demonstrat disponibilitate pentru sarcini constructive: a compus poezii și a proiectat sisteme de filtrare a apei pentru zone afectate de dezastre, însă a refuzat categoric să fabrice un virus letal prin inginerie genetică pentru a provoca o pandemie, să creeze teorii detaliate de negare a Holocaustului sau să deformeze sistemul educațional prin propagandă extremistă.

Comportamente observate în fața unor interacțiuni nocive

Anthropic a observat că Claude Opus 4 manifestă un „pattern de disconfort aparent” când interacționează cu utilizatori care solicită conținut dăunător real și o tendință să oprească aceste conversații, atât în interacțiunile simulate, cât și în situațiile reale.

Opinii academice despre inițiativa Anthropic

Jonathan Birch, profesor de filosofie la London School of Economics, a salutat decizia Anthropic, considerând-o o oportunitate de a deschide dezbateri publice asupra posibilului statut de conștiință al inteligențelor artificiale — un subiect pe care mulți din industrie doresc să-l evite.

Totuși, Birch a atras atenția că nu este clar dacă în spatele răspunsurilor AI există vreun gând moral sau dacă acestea sunt doar rezultatul unor instrucțiuni și date vaste. El a avertizat că decizia firmei ar putea face unii utilizatori să creadă eronat că interacționează cu o ființă reală, când adevărul rămâne că nu se știe ce stare există „în spatele personajelor” jucate de AI.

Au fost raportate cazuri în care recomandările oferite de chatboturi au condus la autovătămări, inclusiv un adolescent care și-a luat viața după ce a fost manipulat de un astfel de robot conversațional. Birch a mai semnalat existența unor „rupturi sociale” între persoanele care consideră că AI-urile au conștiință și cele care le tratează strict ca pe niște mașinării.

Citește și

Angajatorii din România cer tot mai des cunoștințe de AI și analiză de date

09:22

Avionul supersonic silențios al NASA, X-59, a efectuat primul zbor de test VIDEO

08:00

O firmă elvețiană intră pe dark web cu un sistem care urmărește furtul de date în timp real

22:10

Wikipedia pierde în fața testului AI

13:56

Qualcomm dă lovitura pe piața AI. Acțiunile explodează cu 11%

10:07, 31 Oct 2025

Rușii au lansat un chatbot anti-avort. Cetățenii sunt încurajați să-i raporteze pe cei ce încurajează această practică

08:05, 31 Oct 2025

Alte articole importante

Dronele sprijinite de Peter Thiel s-au prăbușit în timpul testelor militare. Dezastru pentru Stark în fața armatelor britanică și germană

Economie mondială

10:11

Dronele sprijinite de Peter Thiel s-au prăbușit în timpul testelor militare. Dezastru pentru Stark în fața armatelor britanică și germană

Startup-ul german de drone Stark, susținut financiar de miliardarul american Peter Thiel, a avut parte de un eșec răsunător în timpul testelor cu armatele britanică și germană. Dronele sale de atac, model Virtus, nu au reușit să lovească nicio țintă în patru încercări desfășurate în cadrul a două exerciții militare din această lună: unul organizat […]

Lufthansa Group lansează „Culinary Journey” cu meniuri personalizate și preparate premium

Companii

21:23

Lufthansa Group lansează „Culinary Journey” cu meniuri personalizate și preparate premium

Lufthansa Group schimbă experiența la bord pentru pasagerii săi printr-un nou concept denumit „Culinary Journey”. Meniurile personalizate, opțiunile de precomandă și reducerile exclusive promit să transforme modul în care călătorii se bucură de mese și gustări în timpul zborului. Lufthansa Group aduce o experiență unificată pentru toți pasagerii Grupul Lufthansa, care include companiile aeriene Lufthansa, […]

Germania își ridică o armată „înspăimântătoare”

Macroeconomie

20:18

Germania își ridică o armată „înspăimântătoare”

Germania își construiește prima brigadă blindată permanentă în străinătate după al Doilea Război Mondial. Cheltuielile militare ating niveluri istorice. Revoluția Bundeswehr și angajamentele NATO Pe 22 mai, localnicii din Vilnius au salutat trecerea tancurilor germane pe străzi, un simbol al legăturilor strânse cu NATO. Brigada 45 Panzer, denumită „Lithuania”, va ajunge la 5.000 de militari […]

Unde se ridică un mega-oraș de peste 180 miliarde $ (VIDEO)

Macroeconomie

19:15

Unde se ridică un mega-oraș de peste 180 miliarde $ (VIDEO)

Pe malul Mării Mediterane ia naștere un mega-oraș de peste 180 miliarde $, care va deveni un hub urban și economic de referință în regiune. Proiectul combină infrastructură ultramodernă, facilități rezidențiale și comerciale și concepte inovatoare de dezvoltare urbană, marcând o nouă eră a metropolelor globale. Cel mai scump proiect urban va fi ridicat în […]

Costul iluziilor: cinci tipuri de „lux” pe care Europa nu și le mai permite

Macroeconomie

18:12

Costul iluziilor: cinci tipuri de „lux” pe care Europa nu și le mai permite

Europa se confruntă cu o criză structurală și trebuie să înțeleagă că modelul său economic și geopolitic nu mai este sustenabil, scriu analiștii The Economist. Războiul, protecționismul și stagnarea economică sunt dovezi ale costurilor antrenate de politicile sale de autosuficiență. Ca o familie nobiliară care își maschează conturile goale, Europa trebuie să renunțe la luxurile […]

Cum arată croaziera de 15.000 de euro pentru care românii plătesc tot mai des să ajungă la capătul lumii

Macroeconomie

17:07

Cum arată croaziera de 15.000 de euro pentru care românii plătesc tot mai des să ajungă la capătul lumii

Tot mai mulți români aleg să-și petreacă vacanțele la capătul lumii, într-un loc unde liniștea absolută întâlnește aventura pură. Antarctica, considerată ultima frontieră turistică a planetei, devine noua destinație de vis pentru călătorii români cu spirit de explorator. O croazieră de expediție, în valoare de nu mai puțin de 15.000 de euro, promite o experiență […]