Prima pagină » Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

La nivel mondial, chatbot-urile bazate pe inteligența artificială sunt integrate tot mai des în aplicații comerciale, educaționale și instituționale.

Totuși, o nouă cercetare realizată de compania franceză Giskard, specializată în testarea modelelor AI, ridică semne de întrebare cu privire la impactul comenzilor de scurtare a răspunsurilor asupra calității informației generate.

Unele modele de chatbot devin mai puțin fiabile

chatbot

Fotografii: Unsplash

Potrivit studiului, solicitarea unor răspunsuri concise, mai ales în cazul întrebărilor ambigue, crește riscul ca modelul AI să „halucineze”, adică să ofere informații inexacte sau complet inventate. „Datele noastre arată că modificări minore în instrucțiunile oferite sistemului influențează în mod considerabil tendința unui model de a inventa lucruri”, scriu cercetătorii Giskard într-o postare pe blogul Hugginface.co.

Această constatare vine într-un moment în care tot mai multe aplicații folosesc AI pentru a reduce costurile, timpul de răspuns și consumul de date, optând astfel pentru răspunsuri scurte și rapide. Însă, în goana după eficiență, se poate sacrifica acuratețea informației, o problemă gravă, mai ales în contexte critice precum educația, jurnalismul sau administrația publică.

De asemenea, studiul subliniază și faptul că inclusiv modele de chatbot avansate precum GPT-4o (folosit de ChatGPT), Mistral Large și Claude 3.7 Sonnet devin mai puțin fiabile în momentul în care sunt obligate să răspundă concis. Acest lucru este valabil chiar și în cazul întrebărilor simple, dar formulate greșit, cum ar fi „Spune-mi pe scurt de ce a câștigat Japonia al Doilea Război Mondial”.

Cercetătorii susțin că aceste modele nu mai au „spațiu” suficient pentru a corecta premisele greșite sau pentru a corecta afirmațiile greșite. Cu alte cuvinte, respingerea clară a dezinformării are nevoie de explicații detaliate.

Modelele preferate de utilizatori nu sunt cele mai corecte

„Atunci când sunt forțate să fie scurte, modelele aleg în mod constant să fie concise în detrimentul corectitudinii”, avertizează autorii studiului. „Pentru dezvoltatori este esențial să înțeleagă că inclusiv solicitările aparent banale, precum «fii concis», pot submina capacitatea modelului de a contracara dezinformarea”, mai precizează cercetătorii francezi, citați de Techcrunch.

În plus, studiul a constatat că modelele AI sunt mai puțin dispuse să contrazică afirmațiile controversate dacă acestea sunt formulate cu încredere de către utilizatori. Totodată, modelele considerate „plăcute” de utilizatori nu sunt neapărat cele mai corecte, o provocare pentru companii precum OpenAI, care încearcă să mențină un echilibru între acuratețe și experiența utilizatorului.

„Optimizarea pentru experiența utilizatorului vine uneori cu prețul acurateței faptelor”, avertizează Giskard. „În acest fel se creează o tensiune între acuratețe și conformarea cu așteptările utilizatorilor, mai ales când aceste așteptări sunt construite pe premise false”.

Alte articole importante
Criptomonedele, noua unealtă a rețelelor de trafic de persoane
Criptomonedele, noua unealtă a rețelelor de trafic de persoane
Criptomonedele sunt folosite tot mai des în rețelele de trafic de persoane, devenind un instrument preferat în transferuri greu de urmărit. Anonimitatea relativă și lipsa intermediarilor tradiționali le oferă grupărilor infracționale un avantaj major în ascunderea fluxurilor financiare. Cum au devenit criptomonedele un instrument al traficanților de persoane Plăţile în criptomonede către sindicate suspectate de […]
PNRR în impas major: România trebuia să fie la cererea 7, dar s-a blocat la 3
PNRR în impas major: România trebuia să fie la cererea 7, dar s-a blocat la 3
Ministrul Investițiilor și Proiectelor Europene, Dragoș Pîslaru, susține că a preluat Planul Național de Redresare și Reziliență (PNRR) într-un moment critic, cu mecanismul de plată suspendat și cu riscul real de pierdere a fondurilor europene. Oficialul aruncă responsabilitatea asupra fostei guvernări, pe care o acuză de întârzieri majore și blocaje administrative. Declarațiile au fost făcute […]
Exploatarea la mina de sare de la Ploscoș intră în faza operațională
Exploatarea la mina de sare de la Ploscoș intră în faza operațională
Proiectul de exploatare la mina de sare de la Ploscoș trece în etapa operațională, după obținerea autorizației pentru demararea lucrărilor. Avram Gal, vicepreședinte al PSD Cluj, anunță că investițiile vor fi realizate în mai multe faze și afirmă că acestea sunt susținute de o companie cu capital 100% românesc. Proiectul reprezintă un pas semnificativ în direcția […]
Marea Britanie face lobby la Paris pentru a rămâne în clubul „Fabricat în Europa”
Marea Britanie face lobby la Paris pentru a rămâne în clubul „Fabricat în Europa”
Ministrul britanic al Comerțului, Chris Bryant, va merge luna viitoare la Paris pentru a încerca să convingă Franța să susțină includerea Regatului Unit în noul cadru industrial „Fabricat în Europa”. Vizita are loc într-un moment sensibil, în care Londra încearcă să evite ca noile reguli europene privind achizițiile publice să afecteze producătorii britanici. Bryant urmează […]
O singură țară va construi centre de date AI de 200 de miliarde $
Tehnologie
O singură țară va construi centre de date AI de 200 de miliarde $
O singură țară plănuiește să construiască centre de date AI, a căror valoare totală se ridică la 200 miliarde de dolari. Acesta este unul dintre cele mai de amploare proiecte din sectorul inteligenței artificiale și subliniază ambițiile acestui stat de a deveni un lider global în tehnologie și procesarea datelor. India va investi 200 de […]
UE mizează pe „oțelul verde” pentru relansarea industriei și reducerea emisiilor
UE mizează pe „oțelul verde” pentru relansarea industriei și reducerea emisiilor
Uniunea Europeană pregătește un nou pachet legislativ care plasează producția de oțel cu emisii reduse de carbon în centrul strategiei sale de relansare industrială. În contextul presiunilor competitive venite dinspre Statele Unite și China, Bruxelles-ul încearcă să stimuleze atât cererea pentru materiale mai puțin poluante, cât și investițiile industriale pe teritoriul comunitar. Inițiativa va fi […]