Prima pagină » Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

La nivel mondial, chatbot-urile bazate pe inteligența artificială sunt integrate tot mai des în aplicații comerciale, educaționale și instituționale.

Totuși, o nouă cercetare realizată de compania franceză Giskard, specializată în testarea modelelor AI, ridică semne de întrebare cu privire la impactul comenzilor de scurtare a răspunsurilor asupra calității informației generate.

Unele modele de chatbot devin mai puțin fiabile

chatbot

Fotografii: Unsplash

Potrivit studiului, solicitarea unor răspunsuri concise, mai ales în cazul întrebărilor ambigue, crește riscul ca modelul AI să „halucineze”, adică să ofere informații inexacte sau complet inventate. „Datele noastre arată că modificări minore în instrucțiunile oferite sistemului influențează în mod considerabil tendința unui model de a inventa lucruri”, scriu cercetătorii Giskard într-o postare pe blogul Hugginface.co.

Această constatare vine într-un moment în care tot mai multe aplicații folosesc AI pentru a reduce costurile, timpul de răspuns și consumul de date, optând astfel pentru răspunsuri scurte și rapide. Însă, în goana după eficiență, se poate sacrifica acuratețea informației, o problemă gravă, mai ales în contexte critice precum educația, jurnalismul sau administrația publică.

De asemenea, studiul subliniază și faptul că inclusiv modele de chatbot avansate precum GPT-4o (folosit de ChatGPT), Mistral Large și Claude 3.7 Sonnet devin mai puțin fiabile în momentul în care sunt obligate să răspundă concis. Acest lucru este valabil chiar și în cazul întrebărilor simple, dar formulate greșit, cum ar fi „Spune-mi pe scurt de ce a câștigat Japonia al Doilea Război Mondial”.

Cercetătorii susțin că aceste modele nu mai au „spațiu” suficient pentru a corecta premisele greșite sau pentru a corecta afirmațiile greșite. Cu alte cuvinte, respingerea clară a dezinformării are nevoie de explicații detaliate.

Modelele preferate de utilizatori nu sunt cele mai corecte

„Atunci când sunt forțate să fie scurte, modelele aleg în mod constant să fie concise în detrimentul corectitudinii”, avertizează autorii studiului. „Pentru dezvoltatori este esențial să înțeleagă că inclusiv solicitările aparent banale, precum «fii concis», pot submina capacitatea modelului de a contracara dezinformarea”, mai precizează cercetătorii francezi, citați de Techcrunch.

În plus, studiul a constatat că modelele AI sunt mai puțin dispuse să contrazică afirmațiile controversate dacă acestea sunt formulate cu încredere de către utilizatori. Totodată, modelele considerate „plăcute” de utilizatori nu sunt neapărat cele mai corecte, o provocare pentru companii precum OpenAI, care încearcă să mențină un echilibru între acuratețe și experiența utilizatorului.

„Optimizarea pentru experiența utilizatorului vine uneori cu prețul acurateței faptelor”, avertizează Giskard. „În acest fel se creează o tensiune între acuratețe și conformarea cu așteptările utilizatorilor, mai ales când aceste așteptări sunt construite pe premise false”.

Alte articole importante
Ecologia, cimitirul start-up-urilor americane: tech-ul climatic din SUA, amenințat de o eventuală administrație Trump 2.0
Ecologia, cimitirul start-up-urilor americane: tech-ul climatic din SUA, amenințat de o eventuală administrație Trump 2.0
Un val de incertitudine lovește sectorul climate tech din Statele Unite: propunerile legislative ale administrației Trump, care vizează eliminarea creditelor fiscale pentru energie verde, este o mișcare care riscă să transforme un ecosistem emergent într-un „cimitir al companiilor”, potrivit investitorilor din domeniu. Ecologia nu mai pare un business rentabil. Sectorul climate tech a resimțit deja […]
Anna Wintour, redactor-șef Vogue, părăsește scena modei cu o avere estimată la 36,5 milioane de lire sterline
Anna Wintour, redactor-șef Vogue, părăsește scena modei cu o avere estimată la 36,5 milioane de lire sterline
După aproape patru decenii în fruntea uneia dintre cele mai influente publicații de modă din lume, Anna Wintour va renunța la poziția de redactor-șef al revistei Vogue SUA, transmite Financial Times. Decizia, anunțată joi, într-o reuniune organizată la redacție, vine în contextul unei reorganizări ample a portofoliului Condé Nast și semnalează o nouă etapă în […]
Economia în derivă a Turciei îi subminează puterea lui Erdoğan
Economia în derivă a Turciei îi subminează puterea lui Erdoğan
Criza costului vieții și tulburările sociale sunt realități care îi periclitează planurile președintelui Erdoğan de a rămâne la putere și, totodată, zădărnicesc aspirațiile geopolitice ale Ankarei, se arată într-o analiză Financial Times. După decenii în care Turcia părea pe punctul de a repeta miracolul sud-coreean – respectiv o transformare economică spectaculoasă, acum pare amenințată de […]
România încheie primele cinci luni din 2025 cu un deficit bugetar de 3,39% din PIB
România încheie primele cinci luni din 2025 cu un deficit bugetar de 3,39% din PIB
România a ajuns la un deficit bugetar de 3,39% din PIB în primele cinci luni din 2025, în ușoară scădere față de aceeași perioadă a anului trecut, când se cifra la 3,41% din PIB. În termeni nominali, deficitul a fost de 64,23 de miliarde lei, față de 60,10 de miliarde lei în perioada similară din […]
Criza vârstei mijlocii? – un simplu mit, spune Zara, la împlinirea vârstei de 50 de ani
Criza vârstei mijlocii? – un simplu mit, spune Zara, la împlinirea vârstei de 50 de ani
Zara împlinește o jumătate de secol de existență, scrie Financial Times, dar nu dă semne de vreo criză a vârstei mijlocii. Principalul brand al gigantului spaniol Inditex rămâne flexibil, în ciuda unei încetiniri vizibile a ritmului de creștere, într-un context economic global marcat de incertitudini. Ultimii ani nu au fost tocmai favorabili industriei de fashion, […]
Inteligența Artificială rescrie regulile jocului pe piața asigurărilor. Sorin Mititelu, vicepreședinte al ASF, invitat la podcastul Puterea Financiară
Inteligența Artificială rescrie regulile jocului pe piața asigurărilor. Sorin Mititelu, vicepreședinte al ASF, invitat la podcastul Puterea Financiară
Cum arată viitorul pieței de asigurări în România și ce rol va juca inteligența artificială în relația dintre asigurat și asigurator? Sorin Mititelu, vicepreședinte al Autorității de Supraveghere Financiară (ASF), explică tendințele din piață la ediția de vineri, 27 iunie, a podcastului Puterea Financiară: de la automatizarea proceselor până la legislația RCA și responsabilitățile viitoare […]