O analiză realizată de Semrush în iunie 2025, preluată de Visual Capitalist, scoate la iveală care sunt cele mai frecvent citate site-uri web de către modelele AI precum ChatGPT atunci când furnizează informații factuale. Studiul examinează peste 150.000 de referințe din dialoguri și demonstrații AI și aduce în prim-plan dependența impresionantă a acestor sisteme de conținut generat de utilizatori.
Datele detaliate arată că platformele dominate de conținutul creat de comunități joacă un rol central în modul în care inteligențele artificiale construiesc răspunsurile. Reddit este cel mai citat domeniu, cu un procent de 40,1% din referințe, urmat de Wikipedia cu 26,3%. YouTube și Google ocupă, de asemenea, poziții de top cu 23,5% și respectiv 23,3%. Acest top indică faptul că discuțiile de tip forum deschis și paginile editate colectiv sunt baza surselor preferate de AI.
Următoarele locuri sunt ocupate de site-uri de review-uri și comerț electronic: Yelp cu 21%, Facebook cu 20%, Amazon cu 18,7% și TripAdvisor cu 12,5%. În plus, pentru date geografice, LLM-urile utilizează frecvent platforme precum Mapbox și OpenStreetMap, ambele fiind citate în proporție de 11,3%. Alte site-uri cu relevanță semnificativă includ Instagram, MapQuest, Walmart, eBay sau LinkedIn.
reddit.com – 40,1%
wikipedia.org – 26,3%
youtube.com – 23,5%
google.com – 23,3%
yelp.com – 21,0%
facebook.com – 20,0%
amazon.com – 18,7%
tripadvisor.com – 12,5%
mapbox.com – 11,3%
openstreetmap.com – 11,3%
instagram.com – 10,9%
mapquest.com – 9,8%
walmart.com – 9,3%
ebay.com – 7,7%
linkedin.com – 5,9%
quora.com – 4,6%
homedepot.com – 4,6%
yahoo.com – 4,4%
target.com – 4,3%
pinterest.com – 4,2%
Această orientare puternică a modelelor AI către conținutul creat de utilizatori deschide însă o serie de provocări și riscuri, dat fiind că astfel de platforme au un sistem de moderare limitat și nu implică întotdeauna experți care să verifice fiecare informație.
Un caz ilustrativ a fost când ChatGPT a sugerat, în mod eronat, utilizatorilor să-și purifice apa consumând înălbitor sau amestecând-o cu oțet, ceea ce generează gaze toxice de clor. Acest exemplu evidențiază cum informațiile lipsă de cunoaștere exactă pot conduce la erori periculoase.
Principalele riscuri identificate în acest context sunt:
Dezinformarea și răspândirea zvonurilor: Lipsa verificării de către profesioniști în domeniu face ca AI să preia și să reia afirmații incorecte sau părtinitoare.
Amplificarea efectului de cameră de ecou: Povești populare dar neconfirmate tind să fie repetate și propagate dacă par credibile sau sunt des discutate, în detrimentul surselor mai puțin vizibile dar corecte.
Absența autorității și controlului editorial: Tematici cu impact major asupra vieții – cum ar fi sănătatea, legislația sau finanțele – necesită informații validate de experți, iar site-urile cu conținut produs de comunitate nu oferă întotdeauna această garanție.
Aceste cifre și observații scot în evidență un aspect esențial al prezentului și viitorului AI-ului: parcurgerea numeroaselor pagini web cu conținut public pentru a învăța și a genera răspunsuri, dar în același timp confruntarea cu calitatea, veridicitatea și părtinirea informațiilor.
Platformele sociale, forumurile deschise și site-urile de review reprezintă o vastă bază de date care reflectă opinia publică și experiențele utilizatorilor, dar care, prin natura sa, este susceptibilă la erori de interpretare sau manipulare.