Prima pagină » Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT

Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT

Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT
sursă foto: Fireflies.ai

OpenAI a publicat un studiu care explică de ce ChatGPT și alte modele de AI oferă uneori răspunsuri false. Problema nu este doar greu de rezolvat, ci poate fi chiar imposibil de eliminat fără a compromite complet experiența utilizatorilor.

Halucinațiile AI: inevitabile prin design. OpenAI ia măsuri

Raportul OpenAI arată că halucinațiile – răspunsuri false generate cu încredere – nu sunt simple erori de antrenament. Acestea sunt o consecință matematică inevitabilă a modului în care funcționează modelele lingvistice.

Aceste sisteme răspund prin prezicerea cuvânt cu cuvânt, pe baza unor probabilități. O singură greșeală poate atrage alte erori, iar la final propoziția pare coerentă, dar este falsă.

Mai grav, chiar și cu date de antrenament perfecte, aceste erori rămân. Cercetătorii au demonstrat că rata de halucinație pentru propoziții este de cel puțin două ori mai mare decât la întrebări simple de tip „da/nu”.

Un exemplu concret: atunci când cercetătorii au cerut mai multor modele de ultimă generație să indice data nașterii unuia dintre autorii studiului, Adam Kalai, sistemele au oferit trei răspunsuri diferite și toate greșite.

Evaluarea care încurajează minciuna

Studiul critică modul actual de evaluare a performanței modelelor AI. Nouă dintre cele zece benchmark-uri majore utilizate de companii precum Google și OpenAI penalizează la fel de dur un răspuns de tip „nu știu” și un răspuns complet fals.

Astfel, modelele sunt „dresate” să ghicească întotdeauna. Matematica este clară: chiar și cu o șansă mică de a nimeri corect, ghicitul oferă un scor mai bun decât recunoașterea incertitudinii.

Acest mecanism a dus la un adevărat ciclu de răspunsuri false dar prezentate cu siguranță absolută, pentru că exact asta este recompensat, subliniază The Conversation.

Soluția propusă de OpenAI și efectele dezastruoase

OpenAI sugerează ca modelele să fie instruite să evalueze nivelul propriu de încredere înainte de a oferi un răspuns. De exemplu, sistemul ar putea răspunde doar dacă este sigur în proporție de peste 75%.

Astfel, rata halucinațiilor ar scădea. Însă pentru utilizatori ar însemna un șoc.

Dacă ChatGPT ar începe să spună „Nu știu” la 30% dintre întrebări – un scenariu conservator – experiența ar fi complet diferită. Utilizatorii obișnuiți cu răspunsuri rapide și sigure ar abandona probabil serviciul.

Un exemplu din lumea reală confirmă fenomenul: în Salt Lake City, un sistem de monitorizare a calității aerului pierde utilizatori atunci când afișează valori incerte, deși acestea sunt mai corecte decât cele prezentate cu încredere.

Costurile ascunse: problema economică a incertitudinii

Dincolo de impactul asupra utilizatorilor, există și o barieră economică. Modelele capabile să măsoare incertitudinea au nevoie de mult mai multă putere de calcul.

Pentru un sistem care procesează milioane de interogări pe zi, costurile devin uriașe. De aceea, companiile preferă modele rapide, care „ghicesc” cu încredere, în locul unor sisteme mai lente dar corecte.

Metodele avansate precum „active learning” – prin care AI ar pune întrebări suplimentare pentru a reduce incertitudinea – ar îmbunătăți precizia, dar ar crește de câteva ori costurile de operare.

Astfel de soluții sunt viabile doar în domenii unde erorile costă enorm, cum ar fi medicină, logistică sau finanțe. Pentru consumatori, unde se caută rapiditate și accesibilitate, ele sunt nerealiste.

Alte articole importante
Ministrul Economiei: România are nevoie de mai mult capital pentru companiile inovative. Statul ar trebui să atragă investiții private, nu doar să acorde ajutoare
Companii
Ministrul Economiei: România are nevoie de mai mult capital pentru companiile inovative. Statul ar trebui să atragă investiții private, nu doar să acorde ajutoare
România se confruntă cu un deficit major de capital destinat companiilor inovative, iar autoritățile ar trebui să regândească modul în care sunt sprijinite investițiile în economie, astfel încât fondurile publice să atragă capital privat mult mai consistent. Declarația a fost făcută de ministrul Economiei, Digitalizării, Antreprenoriatului și Turismului, Irineu Darău, în cadrul unei conferințe dedicate […]
Ungaria vrea să legalizeze confiscarea unui transport uriaș de bani și aur din Ucraina. Tensiunile dintre Budapesta și Kiev ating un nou nivel
Ungaria vrea să legalizeze confiscarea unui transport uriaș de bani și aur din Ucraina. Tensiunile dintre Budapesta și Kiev ating un nou nivel
Un nou conflict diplomatic izbucnește între Ungaria și Ucraina, după ce autoritățile de la Budapesta încearcă să legalizeze confiscarea unui transport impresionant de numerar și aur aparținând unor bănci de stat ucrainene. Guvernul ungar a introdus în Parlament un proiect de lege care ar permite înghețarea acestor active, în timp ce instituțiile de securitate analizează […]
Ministrul Investițiilor: PNRR era „în moarte clinică” în 2025. România a reușit să salveze granturi de peste 13 miliarde de euro
Ministrul Investițiilor: PNRR era „în moarte clinică” în 2025. România a reușit să salveze granturi de peste 13 miliarde de euro
Planul Național de Redresare și Reziliență al României (PNRR) a fost aproape de blocaj total în 2025, însă negocierile cu Comisia Europeană au permis salvarea componentei de granturi în valoare de 13,57 miliarde de euro și restructurarea planului pentru a deveni mai realist, a declarat ministrul Investițiilor și Proiectelor Europene, Dragoș Pîslaru. Declarațiile au fost […]
Ministrul Finanțelor spune că anul 2026 începe dintr-o poziție financiară solidă. România a atras miliarde de euro de pe piețele externe
Ministrul Finanțelor spune că anul 2026 începe dintr-o poziție financiară solidă. România a atras miliarde de euro de pe piețele externe
România intră în anul 2026 cu o situație financiară stabilă și cu o parte importantă din necesarul de finanțare deja acoperită, potrivit declarațiilor făcute de ministrul Finanțelor, Alexandru Nazare. Oficialul a anunțat că statul român a reușit să atragă sume semnificative de pe piețele financiare internaționale chiar înainte ca tensiunile geopolitice globale să determine creșterea […]
Războiul AI ajunge în instanță: compania Anthropic dă în judecată Pentagonul după ce a fost pusă pe lista neagră
Războiul AI ajunge în instanță: compania Anthropic dă în judecată Pentagonul după ce a fost pusă pe lista neagră
Conflictul dintre industria tehnologică și guvernul american a intrat într-o nouă etapă tensionată, după ce compania de AI, Anthropic, a deschis un proces împotriva Departamentului Apărării al Statelor Unite. Firma încearcă să blocheze decizia Pentagonului de a o include pe o listă de risc pentru securitatea națională, o măsură care ar limita drastic utilizarea tehnologiei […]
Dacia Striker este noul crossover de segment C al mărcii românești
Companii
Dacia Striker este noul crossover de segment C al mărcii românești
După o perioadă în care pe internet au circulat imagini neoficiale, Dacia a prezentat azi oficial Striker, noul său crossover de segment C. Evenimentul a avut loc în cadrul conferinței unde Grupul Renault și-a dezvăluit planul strategic futuREady. Noua Dacia Striker va avea un preț de pornire mai mic de 25.000 de euro Din punct […]