Prima pagină » Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

La nivel mondial, chatbot-urile bazate pe inteligența artificială sunt integrate tot mai des în aplicații comerciale, educaționale și instituționale.

Totuși, o nouă cercetare realizată de compania franceză Giskard, specializată în testarea modelelor AI, ridică semne de întrebare cu privire la impactul comenzilor de scurtare a răspunsurilor asupra calității informației generate.

Unele modele de chatbot devin mai puțin fiabile

chatbot

Fotografii: Unsplash

Potrivit studiului, solicitarea unor răspunsuri concise, mai ales în cazul întrebărilor ambigue, crește riscul ca modelul AI să „halucineze”, adică să ofere informații inexacte sau complet inventate. „Datele noastre arată că modificări minore în instrucțiunile oferite sistemului influențează în mod considerabil tendința unui model de a inventa lucruri”, scriu cercetătorii Giskard într-o postare pe blogul Hugginface.co.

Această constatare vine într-un moment în care tot mai multe aplicații folosesc AI pentru a reduce costurile, timpul de răspuns și consumul de date, optând astfel pentru răspunsuri scurte și rapide. Însă, în goana după eficiență, se poate sacrifica acuratețea informației, o problemă gravă, mai ales în contexte critice precum educația, jurnalismul sau administrația publică.

De asemenea, studiul subliniază și faptul că inclusiv modele de chatbot avansate precum GPT-4o (folosit de ChatGPT), Mistral Large și Claude 3.7 Sonnet devin mai puțin fiabile în momentul în care sunt obligate să răspundă concis. Acest lucru este valabil chiar și în cazul întrebărilor simple, dar formulate greșit, cum ar fi „Spune-mi pe scurt de ce a câștigat Japonia al Doilea Război Mondial”.

Cercetătorii susțin că aceste modele nu mai au „spațiu” suficient pentru a corecta premisele greșite sau pentru a corecta afirmațiile greșite. Cu alte cuvinte, respingerea clară a dezinformării are nevoie de explicații detaliate.

Modelele preferate de utilizatori nu sunt cele mai corecte

„Atunci când sunt forțate să fie scurte, modelele aleg în mod constant să fie concise în detrimentul corectitudinii”, avertizează autorii studiului. „Pentru dezvoltatori este esențial să înțeleagă că inclusiv solicitările aparent banale, precum «fii concis», pot submina capacitatea modelului de a contracara dezinformarea”, mai precizează cercetătorii francezi, citați de Techcrunch.

În plus, studiul a constatat că modelele AI sunt mai puțin dispuse să contrazică afirmațiile controversate dacă acestea sunt formulate cu încredere de către utilizatori. Totodată, modelele considerate „plăcute” de utilizatori nu sunt neapărat cele mai corecte, o provocare pentru companii precum OpenAI, care încearcă să mențină un echilibru între acuratețe și experiența utilizatorului.

„Optimizarea pentru experiența utilizatorului vine uneori cu prețul acurateței faptelor”, avertizează Giskard. „În acest fel se creează o tensiune între acuratețe și conformarea cu așteptările utilizatorilor, mai ales când aceste așteptări sunt construite pe premise false”.

Alte articole importante
Rolex scumpește din nou ceasurile de aur. Clienții ultra-bogați continuă să cumpere, în ciuda prețurilor record. Gigantul elvețian majorează prețurile pentru a doua oară în acest an
Analize
Rolex scumpește din nou ceasurile de aur. Clienții ultra-bogați continuă să cumpere, în ciuda prețurilor record. Gigantul elvețian majorează prețurile pentru a doua oară în acest an
Piața globală a ceasurilor de lux oferă un nou semnal că segmentul dedicat celor mai bogați clienți rămâne extrem de puternic. Celebrul producător elvețian Rolex a decis să majoreze din nou prețurile ceasurilor sale din aur, aplicând o creștere medie de aproximativ 5% pe principalele piețe internaționale. Măsura este cu atât mai surprinzătoare cu cât […]
Germania evită la limită recesiunea: cheltuielile masive ale statului țin economia pe linia de plutire
Germania evită la limită recesiunea: cheltuielile masive ale statului țin economia pe linia de plutire
Germania, cea mai mare economie a Europei, continuă să traverseze o perioadă dificilă, iar perspectivele de redresare rămân fragile. Potrivit celor mai recente estimări ale Deutsche Bundesbank, Germania va evita recesiunea în acest an în principal datorită cheltuielilor publice masive pentru apărare și infrastructură. Banca centrală germană avertizează că aceste investiții guvernamentale reprezintă principalul factor […]
Investițiile din România accelerează în 2026: construcțiile și industria trag economia înainte
Investițiile din România accelerează în 2026: construcțiile și industria trag economia înainte
Economia României a început anul 2026 cu un semnal pozitiv din zona investițiilor, după ce valoarea investițiilor nete realizate la nivel național a ajuns la aproximativ 41 de miliarde de lei în primul trimestru. Potrivit datelor publicate de Institutul Național de Statistică, nivelul investițiilor este cu 4,8% mai mare decât cel înregistrat în aceeași perioadă […]
România atrage tot mai mulți turiști străini. Vizitatorii au cheltuit peste 5 miliarde de euro într-un singur an
Macroeconomie
România atrage tot mai mulți turiști străini. Vizitatorii au cheltuit peste 5 miliarde de euro într-un singur an
Turismul internațional continuă să câștige teren în România, iar cifrele din ultimii ani arată o schimbare semnificativă în modul în care țara este percepută de vizitatorii din străinătate. În 2025, turiștii străini au cheltuit peste 5 miliarde de euro pe teritoriul României, un nivel record care confirmă interesul tot mai mare pentru destinațiile locale. Potrivit […]
Record absolut pe Wall Street. SpaceX a intrat la bursă cu cel mai mare IPO din istorie, evaluarea urcă spre 2,2 trilioane de dolari
Piață de Capital - Fonduri
Record absolut pe Wall Street. SpaceX a intrat la bursă cu cel mai mare IPO din istorie, evaluarea urcă spre 2,2 trilioane de dolari
SpaceX a scris vineri istorie pe Wall Street. Compania lui Elon Musk, a debutat pe Nasdaq după cea mai mare ofertă publică inițială din istorie, prin care strânsese deja 75 de miliarde de dolari. Cererea uriașă din prima zi a împins evaluarea spre 2,2 trilioane de dolari și l-a apropiat pe Musk de statutul de […]
Banca Mondială: Revizuire severă pentru prognoza economiei României. Semnal de alarmă pentru creșterea regională
Macroeconomie
Banca Mondială: Revizuire severă pentru prognoza economiei României. Semnal de alarmă pentru creșterea regională
Banca Mondială a revizuit semnificativ în scădere perspectivele economiei României, indicând pentru 2026 o creștere a PIB de 0%, față de prognoza anterioară de 1,3%. Ajustarea marchează o deteriorare importantă a așteptărilor macroeconomice și plasează România într-o zonă de stagnare economică după ani de expansiune. Raportul „Perspectivele Economice Globale” arată că economia românească își va […]