Prima pagină » Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT

Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT

Soluția OpenAI pentru eliminarea „halucinațiilor” ar putea distruge ChatGPT
sursă foto: Fireflies.ai

OpenAI a publicat un studiu care explică de ce ChatGPT și alte modele de AI oferă uneori răspunsuri false. Problema nu este doar greu de rezolvat, ci poate fi chiar imposibil de eliminat fără a compromite complet experiența utilizatorilor.

Halucinațiile AI: inevitabile prin design. OpenAI ia măsuri

Raportul OpenAI arată că halucinațiile – răspunsuri false generate cu încredere – nu sunt simple erori de antrenament. Acestea sunt o consecință matematică inevitabilă a modului în care funcționează modelele lingvistice.

Aceste sisteme răspund prin prezicerea cuvânt cu cuvânt, pe baza unor probabilități. O singură greșeală poate atrage alte erori, iar la final propoziția pare coerentă, dar este falsă.

Mai grav, chiar și cu date de antrenament perfecte, aceste erori rămân. Cercetătorii au demonstrat că rata de halucinație pentru propoziții este de cel puțin două ori mai mare decât la întrebări simple de tip „da/nu”.

Un exemplu concret: atunci când cercetătorii au cerut mai multor modele de ultimă generație să indice data nașterii unuia dintre autorii studiului, Adam Kalai, sistemele au oferit trei răspunsuri diferite și toate greșite.

Evaluarea care încurajează minciuna

Studiul critică modul actual de evaluare a performanței modelelor AI. Nouă dintre cele zece benchmark-uri majore utilizate de companii precum Google și OpenAI penalizează la fel de dur un răspuns de tip „nu știu” și un răspuns complet fals.

Astfel, modelele sunt „dresate” să ghicească întotdeauna. Matematica este clară: chiar și cu o șansă mică de a nimeri corect, ghicitul oferă un scor mai bun decât recunoașterea incertitudinii.

Acest mecanism a dus la un adevărat ciclu de răspunsuri false dar prezentate cu siguranță absolută, pentru că exact asta este recompensat, subliniază The Conversation.

Soluția propusă de OpenAI și efectele dezastruoase

OpenAI sugerează ca modelele să fie instruite să evalueze nivelul propriu de încredere înainte de a oferi un răspuns. De exemplu, sistemul ar putea răspunde doar dacă este sigur în proporție de peste 75%.

Astfel, rata halucinațiilor ar scădea. Însă pentru utilizatori ar însemna un șoc.

Dacă ChatGPT ar începe să spună „Nu știu” la 30% dintre întrebări – un scenariu conservator – experiența ar fi complet diferită. Utilizatorii obișnuiți cu răspunsuri rapide și sigure ar abandona probabil serviciul.

Un exemplu din lumea reală confirmă fenomenul: în Salt Lake City, un sistem de monitorizare a calității aerului pierde utilizatori atunci când afișează valori incerte, deși acestea sunt mai corecte decât cele prezentate cu încredere.

Costurile ascunse: problema economică a incertitudinii

Dincolo de impactul asupra utilizatorilor, există și o barieră economică. Modelele capabile să măsoare incertitudinea au nevoie de mult mai multă putere de calcul.

Pentru un sistem care procesează milioane de interogări pe zi, costurile devin uriașe. De aceea, companiile preferă modele rapide, care „ghicesc” cu încredere, în locul unor sisteme mai lente dar corecte.

Metodele avansate precum „active learning” – prin care AI ar pune întrebări suplimentare pentru a reduce incertitudinea – ar îmbunătăți precizia, dar ar crește de câteva ori costurile de operare.

Astfel de soluții sunt viabile doar în domenii unde erorile costă enorm, cum ar fi medicină, logistică sau finanțe. Pentru consumatori, unde se caută rapiditate și accesibilitate, ele sunt nerealiste.

Alte articole importante
Facturi mai mici la gaze pentru milioane de români. ANRE reduce tariful mediu de distribuție cu peste 7% de la 1 iulie
Facturi mai mici la gaze pentru milioane de români. ANRE reduce tariful mediu de distribuție cu peste 7% de la 1 iulie
Românii racordați la rețelele de gaze naturale vor beneficia, începând cu 1 iulie 2026, de tarife mai mici pentru serviciul de distribuție, după ce Autoritatea Națională de Reglementare în domeniul Energiei (ANRE) a aprobat noul pachet de tarife reglementate aplicabile la nivel național. Decizia vizează cei 27 de operatori de distribuție licențiați din România și […]
Bruxelles-ul deja își planifică următoarea criză bancară
Bruxelles-ul deja își planifică următoarea criză bancară
Bruxelles-ul pregătește deja terenul pentru următoarea criză bancară. La trei ani după colapsul Credit Suisse și la aproape două decenii de la criza financiară globală din 2008, Comisia Europeană lucrează la un nou mecanism menit să împiedice transformarea falimentului unei bănci majore într-o problemă sistemică pentru întreaga economie europeană. Potrivit unui document confidențial consultat de […]
Costurile de împrumut ale României se reduc după detensionarea conflictului din Orientul Mijlociu. Ce se întâmplă cu dobânzile și petrolul
Costurile de împrumut ale României se reduc după detensionarea conflictului din Orientul Mijlociu. Ce se întâmplă cu dobânzile și petrolul
România beneficiază de un val de optimism pe piețele financiare internaționale, după semnalele privind o posibilă normalizare a relațiilor dintre Statele Unite și Iran. Relaxarea tensiunilor geopolitice a avut efecte imediate asupra piețelor de obligațiuni și asupra cotațiilor petrolului, iar investitorii au început să reevalueze riscurile din regiune. Costurile de finanțare ale statului român au […]
Doi frați, două voturi opuse și aceeași concluzie după un deceniu de Brexit
Doi frați, două voturi opuse și aceeași concluzie după un deceniu de Brexit
La un deceniu după referendumul care a schimbat cursul Marii Britanii, doi frați din Nottingham, aflați cândva în tabere opuse, ajung la aceeași concluzie: Brexitul nu a adus rezultatele pe care le sperau. Deși au votat diferit în 2016 și au apărat cu pasiune poziții contrare, astăzi amândoi privesc cu dezamăgire efectele ieșirii Regatului Unit […]
Expansiunea platformelor non-UE ar putea costa România 1,78 miliarde de lei și mii de locuri de muncă. Avertisment privind dezechilibrele din comerțul online
Macroeconomie
Expansiunea platformelor non-UE ar putea costa România 1,78 miliarde de lei și mii de locuri de muncă. Avertisment privind dezechilibrele din comerțul online
Creșterea rapidă a platformelor de comerț electronic din afara Uniunii Europene ar putea avea efecte semnificative asupra economiei României, dacă nu sunt implementate reguli considerate echitabile de concurență, arată un studiu realizat de Academia de Studii Economice din București, citat de Asociația Română a Magazinelor Online (ARMO). Potrivit analizei, efectele nu se rezumă doar la […]
Veniturile reale ale românilor au crescut cu 160% în 15 ani, dar România rămâne sub media UE. Inegalitățile încă persistă
Piață de Capital - Fonduri
Veniturile reale ale românilor au crescut cu 160% în 15 ani, dar România rămâne sub media UE. Inegalitățile încă persistă
România a înregistrat în ultimul deceniu și jumătate cea mai rapidă creștere a veniturilor reale din Uniunea Europeană, însă diferențele față de media europeană rămân semnificative, iar inegalitățile de venit continuă să fie ridicate, arată o analiză realizată de Monitorul Social, proiect al Friedrich-Ebert-Stiftung România. Datele Eurostat, prelucrate în cadrul raportului, indică o evoluție puternică […]