Prima pagină » Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

La nivel mondial, chatbot-urile bazate pe inteligența artificială sunt integrate tot mai des în aplicații comerciale, educaționale și instituționale.

Totuși, o nouă cercetare realizată de compania franceză Giskard, specializată în testarea modelelor AI, ridică semne de întrebare cu privire la impactul comenzilor de scurtare a răspunsurilor asupra calității informației generate.

Unele modele de chatbot devin mai puțin fiabile

chatbot

Fotografii: Unsplash

Potrivit studiului, solicitarea unor răspunsuri concise, mai ales în cazul întrebărilor ambigue, crește riscul ca modelul AI să „halucineze”, adică să ofere informații inexacte sau complet inventate. „Datele noastre arată că modificări minore în instrucțiunile oferite sistemului influențează în mod considerabil tendința unui model de a inventa lucruri”, scriu cercetătorii Giskard într-o postare pe blogul Hugginface.co.

Această constatare vine într-un moment în care tot mai multe aplicații folosesc AI pentru a reduce costurile, timpul de răspuns și consumul de date, optând astfel pentru răspunsuri scurte și rapide. Însă, în goana după eficiență, se poate sacrifica acuratețea informației, o problemă gravă, mai ales în contexte critice precum educația, jurnalismul sau administrația publică.

De asemenea, studiul subliniază și faptul că inclusiv modele de chatbot avansate precum GPT-4o (folosit de ChatGPT), Mistral Large și Claude 3.7 Sonnet devin mai puțin fiabile în momentul în care sunt obligate să răspundă concis. Acest lucru este valabil chiar și în cazul întrebărilor simple, dar formulate greșit, cum ar fi „Spune-mi pe scurt de ce a câștigat Japonia al Doilea Război Mondial”.

Cercetătorii susțin că aceste modele nu mai au „spațiu” suficient pentru a corecta premisele greșite sau pentru a corecta afirmațiile greșite. Cu alte cuvinte, respingerea clară a dezinformării are nevoie de explicații detaliate.

Modelele preferate de utilizatori nu sunt cele mai corecte

„Atunci când sunt forțate să fie scurte, modelele aleg în mod constant să fie concise în detrimentul corectitudinii”, avertizează autorii studiului. „Pentru dezvoltatori este esențial să înțeleagă că inclusiv solicitările aparent banale, precum «fii concis», pot submina capacitatea modelului de a contracara dezinformarea”, mai precizează cercetătorii francezi, citați de Techcrunch.

În plus, studiul a constatat că modelele AI sunt mai puțin dispuse să contrazică afirmațiile controversate dacă acestea sunt formulate cu încredere de către utilizatori. Totodată, modelele considerate „plăcute” de utilizatori nu sunt neapărat cele mai corecte, o provocare pentru companii precum OpenAI, care încearcă să mențină un echilibru între acuratețe și experiența utilizatorului.

„Optimizarea pentru experiența utilizatorului vine uneori cu prețul acurateței faptelor”, avertizează Giskard. „În acest fel se creează o tensiune între acuratețe și conformarea cu așteptările utilizatorilor, mai ales când aceste așteptări sunt construite pe premise false”.

Alte articole importante
SUA și China anunță „progrese semnificative” în reducerea deficitului comercial bilateral
SUA și China anunță „progrese semnificative” în reducerea deficitului comercial bilateral
Într-un climat economic global marcat de incertitudini și confruntări comerciale, Statele Unite și China par să fi făcut un pas important spre detensionarea relațiilor bilaterale, după două zile de negocieri intense desfășurate la Geneva. Cele două superputeri au înregistrat „progrese semnificative” în cadrul negocierilor pentru diminuarea deficitului comercial bilateral, potrivit unei declarații oficiale transmise de […]
Producția de gaze de la Caragele a crescut cu peste 22%. Sebastian Burduja anunță învestiții noi în extindere de 1,3 miliarde lei
Producția de gaze de la Caragele a crescut cu peste 22%. Sebastian Burduja anunță învestiții noi în extindere de 1,3 miliarde lei
Producția de gaz la Caragele a fost, în 2024, cu 22,48% mai mare față de 2023, stația devenind, astfel, al doilea zăcământ ca pondere în producția totală a Romgaz (6,6% din total producției), anunță, într- postare distribuită pe rețelele de socializare, ministrul Sebastian Burduja.  “Anul trecut, România a devenit, în premieră, cel mai mare producător […]
AI-ul dă verdictul: topul facultăților care nu-ți mai aduc un job în 2025
Tehnologie
AI-ul dă verdictul: topul facultăților care nu-ți mai aduc un job în 2025
O analiză bazată pe date realizată cu ajutorul inteligenței artificiale arată care sunt specializările universitare considerate tot mai puțin relevante pe piața muncii actuală. Deși multe dintre aceste domenii au o valoare culturală și intelectuală incontestabilă, rata scăzută cu posibilitate de angajare și lipsa aplicabilității imediate le plasează în zone de risc din punct de […]
Selfie-ul care îți va spune totul despre sănătatea ta (VIDEO)
Selfie-ul care îți va spune totul despre sănătatea ta (VIDEO)
Într-o eră în care inteligența artificială redefinește limitele medicinei, un nou algoritm bazat pe un banal selfie, dezvoltat în SUA, va transforma modul de evaluare a stării de sănătate a pacienților. Printr-o simplă fotografie a feței, sistemul poate estima vârsta biologică și chiar șansele de supraviețuire în cazul bolnavilor de cancer. Un selfie, mai eficient […]
Prețurile la energie zguduie industria chimică în Europa. Marii jucători caută alternative mai ieftine
Prețurile la energie zguduie industria chimică în Europa. Marii jucători caută alternative mai ieftine
Tot mai multe companii multinaționale din industria chimică iau în calcul vânzarea sau restructurarea operațiunilor din Europa, pe fondul unui climat economic nefavorabil. Motivul? Prețurile mari la energie și competiția acerbă venită din Asia și Orientul Mijlociu, acolo unde noile unități de producție dispun de costuri mai mici și reglementări mai permisive. Prețuri de 4-5 […]
Generația Z evită funcțiile de conducere pentru a-și proteja echilibrul emoțional
Generația Z evită funcțiile de conducere pentru a-și proteja echilibrul emoțional
Generația Z pare să rescrie regulile jocului în lumea muncii: din ce în ce mai mulți tineri refuză să accepte roluri de conducere, preferând să își păstreze sănătatea mintală și echilibrul între viața personală și cea profesională. Specialiștii în cultura organizațională avertizează că acest fenomen, numit „conscious unbossing”, ar trebui să fie un semnal de […]