Prima pagină » Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT

Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT

Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT
sursă foto: Fireflies.ai

OpenAI a publicat un studiu care explică de ce ChatGPT și alte modele de AI oferă uneori răspunsuri false. Problema nu este doar greu de rezolvat, ci poate fi chiar imposibil de eliminat fără a compromite complet experiența utilizatorilor.

Halucinațiile AI: inevitabile prin design. OpenAI ia măsuri

Raportul OpenAI arată că halucinațiile – răspunsuri false generate cu încredere – nu sunt simple erori de antrenament. Acestea sunt o consecință matematică inevitabilă a modului în care funcționează modelele lingvistice.

Aceste sisteme răspund prin prezicerea cuvânt cu cuvânt, pe baza unor probabilități. O singură greșeală poate atrage alte erori, iar la final propoziția pare coerentă, dar este falsă.

Mai grav, chiar și cu date de antrenament perfecte, aceste erori rămân. Cercetătorii au demonstrat că rata de halucinație pentru propoziții este de cel puțin două ori mai mare decât la întrebări simple de tip „da/nu”.

Un exemplu concret: atunci când cercetătorii au cerut mai multor modele de ultimă generație să indice data nașterii unuia dintre autorii studiului, Adam Kalai, sistemele au oferit trei răspunsuri diferite și toate greșite.

Evaluarea care încurajează minciuna

Studiul critică modul actual de evaluare a performanței modelelor AI. Nouă dintre cele zece benchmark-uri majore utilizate de companii precum Google și OpenAI penalizează la fel de dur un răspuns de tip „nu știu” și un răspuns complet fals.

Astfel, modelele sunt „dresate” să ghicească întotdeauna. Matematica este clară: chiar și cu o șansă mică de a nimeri corect, ghicitul oferă un scor mai bun decât recunoașterea incertitudinii.

Acest mecanism a dus la un adevărat ciclu de răspunsuri false dar prezentate cu siguranță absolută, pentru că exact asta este recompensat, subliniază The Conversation.

Soluția propusă de OpenAI și efectele dezastruoase

OpenAI sugerează ca modelele să fie instruite să evalueze nivelul propriu de încredere înainte de a oferi un răspuns. De exemplu, sistemul ar putea răspunde doar dacă este sigur în proporție de peste 75%.

Astfel, rata halucinațiilor ar scădea. Însă pentru utilizatori ar însemna un șoc.

Dacă ChatGPT ar începe să spună „Nu știu” la 30% dintre întrebări – un scenariu conservator – experiența ar fi complet diferită. Utilizatorii obișnuiți cu răspunsuri rapide și sigure ar abandona probabil serviciul.

Un exemplu din lumea reală confirmă fenomenul: în Salt Lake City, un sistem de monitorizare a calității aerului pierde utilizatori atunci când afișează valori incerte, deși acestea sunt mai corecte decât cele prezentate cu încredere.

Costurile ascunse: problema economică a incertitudinii

Dincolo de impactul asupra utilizatorilor, există și o barieră economică. Modelele capabile să măsoare incertitudinea au nevoie de mult mai multă putere de calcul.

Pentru un sistem care procesează milioane de interogări pe zi, costurile devin uriașe. De aceea, companiile preferă modele rapide, care „ghicesc” cu încredere, în locul unor sisteme mai lente dar corecte.

Metodele avansate precum „active learning” – prin care AI ar pune întrebări suplimentare pentru a reduce incertitudinea – ar îmbunătăți precizia, dar ar crește de câteva ori costurile de operare.

Astfel de soluții sunt viabile doar în domenii unde erorile costă enorm, cum ar fi medicină, logistică sau finanțe. Pentru consumatori, unde se caută rapiditate și accesibilitate, ele sunt nerealiste.

Alte articole importante
DECLARAȚII EXCLUSIVE
Eveniment Puterea Financiară. Președintele ASF, Alexandru Petrescu, apel pentru o arhitectură financiară inteligentă în era AI: ASF privește tehnologia ca pe o direcție strategică de acțiune
Eveniment Puterea Financiară. Președintele ASF, Alexandru Petrescu, apel pentru o arhitectură financiară inteligentă în era AI: ASF privește tehnologia ca pe o direcție strategică de acțiune
România are nevoie de o reconstrucție structurală a supravegherii financiare, bazată pe interoperabilitate instituțională, arhitectură comună de date și integrarea tehnologiei — în special AI — ca instrument de analiză și anticipare a riscului. Acesta este mesajul-cheie transmis de președintele Autorității de Supraveghere Financiară (ASF), Alexandru Petrescu, la dezbaterea „Business în era AI” organizată de […]
ANALIZĂ
Topul ţărilor în care nomazii digitali trăiesc cel mai bine
Topul ţărilor în care nomazii digitali trăiesc cel mai bine
Nomazii digitali caută din ce în ce mai multe țări unde pot duce o viață liniștită, lipsită de probleme. Șapte dintre cele mai atractive destinații pentru muncă de la distanță se află în Europa. Un nou studiu arată unde se trăiește cel mai bine și ce avantaje oferă fiecare țară. O nouă eră pentru muncă: […]
Raport: chiria pe 10 ani, mai scumpă decât o garsonieră în 2015
Raport: chiria pe 10 ani, mai scumpă decât o garsonieră în 2015
O analiză imobiliare.net arată că decizia de a plăti o chirie în ultimul deceniu s-a transformat într-o pierdere uriașă. Costurile lunare au depășit valoarea de achiziție a unei garsoniere noi din 2015, iar astăzi prețurile aproape s-au dublat. Chiria – o „capcană” care a înghițit economiile românilor Un raport publicat de portalul imobiliare.net, pe baza […]
Companiile își mută focusul pe clienții bogați
Companiile își mută focusul pe clienții bogați
Industria aeriană, retailul și restaurantele își schimbă strategiile. Companiile se mută către clienții cu venituri mari, în timp ce cei cu bugete reduse rămân tot mai marginalizați. Fast-food-ul devine „premium”, iar avioanele clase de lux pe roți. Companiile mizează pe clienții bogați Lanțurile de fast-food, cunoscute pentru meniurile accesibile, au început să adauge produse premium. […]
Utopie? Vehiculele fără șofer transformă radical orașele
Utopie? Vehiculele fără șofer transformă radical orașele
Robotaxiurile vor remodela economiile urbane, urmând să schimbe, în ritm accelerat, mobilitatea, costurile și structura orașelor. Ascensiunea rapidă a robotaxiurilor schimbă toate regulile Mobilitatea urbană, modul în care circulă locuitorii, este o realitate care se va transforma profund în următorii ani. Procesul se va derula într-un ritm nemaivăzut, scrie The Economist. Robotaxiurile circulă deja autonom […]
ANALIZĂ
Costul economic al violenței la nivel global. Aceste țări au cheltuit miliarde pe securitate internă și investiții militare
Costul economic al violenței la nivel global. Aceste țări au cheltuit miliarde pe securitate internă și investiții militare
Costul economic al violenței a ajuns în 2024 la 20 trilioane de dolari, calculat în termeni de paritate a puterii de cumpărare (PPP). Această valoare include cheltuieli militare, pierderi de PIB, costuri legate de securitate internă și efectele refugiaților. Cheltuielile militare și de securitate au reprezentat 74% din total, reflectând fragmentarea geopolitică și tensiunile internaționale.  […]