Prima pagină » Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT

Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT

Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT
sursă foto: Fireflies.ai

OpenAI a publicat un studiu care explică de ce ChatGPT și alte modele de AI oferă uneori răspunsuri false. Problema nu este doar greu de rezolvat, ci poate fi chiar imposibil de eliminat fără a compromite complet experiența utilizatorilor.

Halucinațiile AI: inevitabile prin design. OpenAI ia măsuri

Raportul OpenAI arată că halucinațiile – răspunsuri false generate cu încredere – nu sunt simple erori de antrenament. Acestea sunt o consecință matematică inevitabilă a modului în care funcționează modelele lingvistice.

Aceste sisteme răspund prin prezicerea cuvânt cu cuvânt, pe baza unor probabilități. O singură greșeală poate atrage alte erori, iar la final propoziția pare coerentă, dar este falsă.

Mai grav, chiar și cu date de antrenament perfecte, aceste erori rămân. Cercetătorii au demonstrat că rata de halucinație pentru propoziții este de cel puțin două ori mai mare decât la întrebări simple de tip „da/nu”.

Un exemplu concret: atunci când cercetătorii au cerut mai multor modele de ultimă generație să indice data nașterii unuia dintre autorii studiului, Adam Kalai, sistemele au oferit trei răspunsuri diferite și toate greșite.

Evaluarea care încurajează minciuna

Studiul critică modul actual de evaluare a performanței modelelor AI. Nouă dintre cele zece benchmark-uri majore utilizate de companii precum Google și OpenAI penalizează la fel de dur un răspuns de tip „nu știu” și un răspuns complet fals.

Astfel, modelele sunt „dresate” să ghicească întotdeauna. Matematica este clară: chiar și cu o șansă mică de a nimeri corect, ghicitul oferă un scor mai bun decât recunoașterea incertitudinii.

Acest mecanism a dus la un adevărat ciclu de răspunsuri false dar prezentate cu siguranță absolută, pentru că exact asta este recompensat, subliniază The Conversation.

Soluția propusă de OpenAI și efectele dezastruoase

OpenAI sugerează ca modelele să fie instruite să evalueze nivelul propriu de încredere înainte de a oferi un răspuns. De exemplu, sistemul ar putea răspunde doar dacă este sigur în proporție de peste 75%.

Astfel, rata halucinațiilor ar scădea. Însă pentru utilizatori ar însemna un șoc.

Dacă ChatGPT ar începe să spună „Nu știu” la 30% dintre întrebări – un scenariu conservator – experiența ar fi complet diferită. Utilizatorii obișnuiți cu răspunsuri rapide și sigure ar abandona probabil serviciul.

Un exemplu din lumea reală confirmă fenomenul: în Salt Lake City, un sistem de monitorizare a calității aerului pierde utilizatori atunci când afișează valori incerte, deși acestea sunt mai corecte decât cele prezentate cu încredere.

Costurile ascunse: problema economică a incertitudinii

Dincolo de impactul asupra utilizatorilor, există și o barieră economică. Modelele capabile să măsoare incertitudinea au nevoie de mult mai multă putere de calcul.

Pentru un sistem care procesează milioane de interogări pe zi, costurile devin uriașe. De aceea, companiile preferă modele rapide, care „ghicesc” cu încredere, în locul unor sisteme mai lente dar corecte.

Metodele avansate precum „active learning” – prin care AI ar pune întrebări suplimentare pentru a reduce incertitudinea – ar îmbunătăți precizia, dar ar crește de câteva ori costurile de operare.

Astfel de soluții sunt viabile doar în domenii unde erorile costă enorm, cum ar fi medicină, logistică sau finanțe. Pentru consumatori, unde se caută rapiditate și accesibilitate, ele sunt nerealiste.

Alte articole importante
Cinci moduri în care conflictul din Iran dă peste cap planurile energetice ale Europei
Cinci moduri în care conflictul din Iran dă peste cap planurile energetice ale Europei
Uniunea Europeană se confrunta deja cu o ecuație energetică fragilă, marcată de prețuri ridicate și de eforturi costisitoare de diversificare după ruptura de Rusia. Escaladarea militară din jurul Iranului și blocajele din Golful Persic au adăugat un nou strat de incertitudine, punând presiune pe piețe, pe guverne și pe industrie. Atacurile lansate de Statele Unite […]
Băncile domină topul profiturilor în România, depășind giganții din energie
Băncile domină topul profiturilor în România, depășind giganții din energie
Cu un profit net de 4,1 miliarde de lei, Banca Transilvania stabilește un nou reper pe piața locală în clasamentul celor mai profitabile afaceri din România în 2025, lăsând în urmă inclusiv companiile din energie, depășind rezultatele unor jucători majori precum Romgaz sau OMV Petrom. Chiar dacă rentabilitatea capitalurilor proprii (ROE) la nivelul întregului sistem […]
Costurile la care se împrumută România urcă la 6,7% pe fondul războiului din Iran
Costurile la care se împrumută România urcă la 6,7% pe fondul războiului din Iran
Războiul din Orientul Mijlociu produce efecte rapide pe piețele financiare, iar România resimte deja impactul. Costurile la care statul român se împrumută pe piețele internaționale au crescut abrupt, ajungând miercuri dimineață la 6,7% pentru titlurile de stat pe 10 ani, în urcare față de aproximativ 6,2% la finalul lunii februarie. Comparativ cu ziua anterioară, randamentele […]
Imperiul secret al lui Ali Khamenei: conturi ascunse, proprietăți de lux și marea întrebare – cine preia averea de peste 100 de miliarde de dolari?
Imperiul secret al lui Ali Khamenei: conturi ascunse, proprietăți de lux și marea întrebare – cine preia averea de peste 100 de miliarde de dolari?
În timp ce milioane de iranieni se luptau cu inflația galopantă, deprecierea monedei și lipsurile de zi cu zi, în culisele puterii s-ar fi consolidat un adevărat imperiu financiar. După moartea liderului suprem al Iranului, ucis în weekend în atacuri aeriene atribuite Israelului, atenția se îndreaptă nu doar spre viitorul regimului, ci și spre uriașa […]
Lumea financiară se rescrie: investitorii combină crypto și piețele tradiționale într-o nouă strategie hibridă
Lumea financiară se rescrie: investitorii combină crypto și piețele tradiționale într-o nouă strategie hibridă
Granițele dintre investițiile tradiționale și activele digitale se estompează rapid, pe măsură ce tehnologia, reglementarea și contextul macroeconomic redesenează regulile jocului. Investitorii nu mai mizează exclusiv pe convingeri personale sau pe modele istorice, ci își construiesc portofolii tot mai structurate, orientate către reziliență și adaptabilitate. Potrivit lui Ignacio Aguirre Franco, director de marketing al Bitget, […]
Dacia dezvăluie în această săptămână numele noului crossover
Companii
Dacia dezvăluie în această săptămână numele noului crossover
Dacia se pregătește să dezvăluie în această săptămână numele noului său crossover, unul dintre cele mai așteptate modele pe piața europeană. Momentul face parte din planul futuREady al Grupului Renault și vine într-un moment în care constructorul auto de la Mioveni își extinde portofoliul de automobile. Numele noului crossover pe care Dacia îl va lansa […]