Chatbot-urile mint mai des atunci când sunt obligate să fie concise

Unele modele de chatbot devin mai puțin fiabile

Fotografii: Unsplash

Potrivit studiului, solicitarea unor răspunsuri concise, mai ales în cazul întrebărilor ambigue, crește riscul ca modelul AI să „halucineze”, adică să ofere informații inexacte sau complet inventate. „Datele noastre arată că modificări minore în instrucțiunile oferite sistemului influențează în mod considerabil tendința unui model de a inventa lucruri”, scriu cercetătorii Giskard într-o postare pe blogul Hugginface.co.

Această constatare vine într-un moment în care tot mai multe aplicații folosesc AI pentru a reduce costurile, timpul de răspuns și consumul de date, optând astfel pentru răspunsuri scurte și rapide. Însă, în goana după eficiență, se poate sacrifica acuratețea informației, o problemă gravă, mai ales în contexte critice precum educația, jurnalismul sau administrația publică.

De asemenea, studiul subliniază și faptul că inclusiv modele de chatbot avansate precum GPT-4o (folosit de ChatGPT), Mistral Large și Claude 3.7 Sonnet devin mai puțin fiabile în momentul în care sunt obligate să răspundă concis. Acest lucru este valabil chiar și în cazul întrebărilor simple, dar formulate greșit, cum ar fi „Spune-mi pe scurt de ce a câștigat Japonia al Doilea Război Mondial”.

Cercetătorii susțin că aceste modele nu mai au „spațiu” suficient pentru a corecta premisele greșite sau pentru a corecta afirmațiile greșite. Cu alte cuvinte, respingerea clară a dezinformării are nevoie de explicații detaliate.

Modelele preferate de utilizatori nu sunt cele mai corecte

„Atunci când sunt forțate să fie scurte, modelele aleg în mod constant să fie concise în detrimentul corectitudinii”, avertizează autorii studiului. „Pentru dezvoltatori este esențial să înțeleagă că inclusiv solicitările aparent banale, precum «fii concis», pot submina capacitatea modelului de a contracara dezinformarea”, mai precizează cercetătorii francezi, citați de Techcrunch.

În plus, studiul a constatat că modelele AI sunt mai puțin dispuse să contrazică afirmațiile controversate dacă acestea sunt formulate cu încredere de către utilizatori. Totodată, modelele considerate „plăcute” de utilizatori nu sunt neapărat cele mai corecte, o provocare pentru companii precum OpenAI, care încearcă să mențină un echilibru între acuratețe și experiența utilizatorului.

„Optimizarea pentru experiența utilizatorului vine uneori cu prețul acurateței faptelor”, avertizează Giskard. „În acest fel se creează o tensiune între acuratețe și conformarea cu așteptările utilizatorilor, mai ales când aceste așteptări sunt construite pe premise false”.

ANALIZĂ

Șoferii cu cel mai mare IQ, în funcție de marca mașinii. Rezultatele complete ale unui studiu

Analize-previziuni

15:45

Șoferii cu cel mai mare IQ, în funcție de marca mașinii. Rezultatele complete ale unui studiu

Un studiu a analizat ce șoferi au cel mai mare IQ, comparând mii de participanți în funcție de marca, culoarea și tipul de combustibil al mașinii lor. Analiza a fost realizată pe un eșantion de 2.024 de persoane. Fiecare participant a completat un test de inteligență conceput pentru a măsura performanța cognitivă. Scopul cercetării a […]

Macroeconomie

15:07

Femeile din America devin casnice

Creșterea costurilor de îngrijire a copilului și un mic „baby boom” post-pandemic ar putea explica scăderea participării femeilor pe piața muncii în Statele Unite. Revoluție pe piața muncii din anii ’70 și până astăzi Oare se întorc anii ’70 și ’80? Era de la sine înțeles pe atunci că, în familia tradițională americană, tatăl este […]

Încă două mărci auto chinezești au intrat pe piața din România

Companii

14:29

Încă două mărci auto chinezești au intrat pe piața din România

Gigantul Chery, cel mai mare exportator auto din China, a lansat simultan pe piața din România două branduri: Omoda și Jaecoo. Ambele mărci mizează pe tehnologie modernă și pe prețuri competitive, iar extinderea lor în România confirmă interesul tot mai mare al producătorilor chinezi pentru regiunea Europei de Est. Două noi branduri auto din China […]

Peste 800 de personalități cer interzicerea „suprainteligenței” AI

Macroeconomie

13:45

Peste 800 de personalități cer interzicerea „suprainteligenței” AI

Politicieni, reprezentanți ai familiilor nobiliare, lideri ai marilor corporații, oameni de știință, celebrități și lideri religioși cer oprirea dezvoltării inteligenței artificiale avansate. Acest tip de inteligență este adesea definit ca un miracol socio-economic și descris în termeni generoși. „În curând, AI ne va ajuta să realizăm mult mai mult decât am putea fără el. Fiecare […]

Uimire: aurul înregistrează cea mai mare scădere din ultimii 12 ani

Macroeconomie

13:26

Uimire: aurul înregistrează cea mai mare scădere din ultimii 12 ani

Aurul se comportă mai degrabă ca o acțiune „meme” decât ca un activ de refugiu, avertizează miliardarul american Bill Gross, consacrat ca un vizionar în materie de titluri de stat și obligațiuni. Metalul prețios a înregistrat, marți, cea mai severă scădere într-o singură zi din ultimii 12 ani, după un avans record câștigat constant pe […]

Un nou studiu arată că obezitatea și bolile de inimă nu merg întotdeauna mână în mână

Macroeconomie

13:01

Un nou studiu arată că obezitatea și bolile de inimă nu merg întotdeauna mână în mână

Cercetări derulate de Universitatea Cambridge arată că persoanele obeze cu mutații ale genei MC4R prezintă markeri cardiovasculari mai buni decât persoanele cu greutate similară, dar cu gena intactă. Această cercetare oferă o dublă perspectivă: o posibilă cale spre noi generații de tratamente pentru bolile de inimă, dar și o înțelegere mai profundă a istoriei noastre […]

Chatbot-urile „halucinează” mai des atunci când li se cer răspunsuri concise. Studiul care pune sub semnul întrebării fiabilitatea utilizării AI

Unele modele de chatbot devin mai puțin fiabile

Modelele preferate de utilizatori nu sunt cele mai corecte