Prima pagină » Credința în zeii AI atotștiutori a intrat în declin

Credința în zeii AI atotștiutori a intrat în declin

Credința în zeii AI atotștiutori a intrat în declin
Credința în zeii AI atotștiutori a intrat în declin

Deși LLM impresionează prin versatilitate, companiile migrează spre SLM, mai ieftine, eficiente și ușor de adaptat nevoilor specifice.

Când se vorbește despre progresul modelelor lingvistice de mari dimensiuni (LLM), cea mai la îndemână analogie este cu smartphone-urile. Primele zile ale lui ChatGPT au fost la fel de revoluționare ca lansarea iPhone-ului de la Apple, în 2007. Dar avansurile inteligenței artificiale au început să semene mai degrabă cu actualizări banale de telefoane.
GPT-5, cel mai recent model al OpenAI, este un exemplu. A stârnit mai puțin entuziasm decât iPhone 17, care urmează să fie prezentat pe 9 septembrie, se arată într-o analiză The Economist.

Modelele mai mici și mai agile câștigă teren în mediul corporativ

Ritmul încetinit al progreselor în inteligența artificială generativă de ultimă generație este un semn că LLM-urile nu prea își îndeplinesc promisiunile, comentează sursa citatată. Declinul aparent ar putea fi explicat prin ascensiunea alternativelor mai mici și mai agile, care câștigă teren în mediul corporativ. Multe companii preferă modele personalizate, adaptate nevoilor lor specifice. Aceste așa-numite modele lingvistice mici (SLM) sunt mai ieftine decât LLM-urile universale, a căror inteligență, „asemănătoare cu cea a unui zeu”, poate părea, uneori, inutilă. „Chatbotul de resurse umane nu are nevoie să știe fizică avansată”, explică David Cox, șeful cercetării în domeniul modelelor AI la IBM.

Pe lângă faptul că sunt la fel de ușor de rulat pe infrastructura IT internă a unei companii, ca și prin furnizori de servicii cloud, SLM-urile pot fi chiar mai utile pentru agenții AI, care efectuează sarcini de muncă alături sau în locul oamenilor. Dimensiunea lor mai mică le face deosebit de potrivite pentru smartphone-uri, mașini autonome, roboți și alte dispozitive – unde eficiența energetică și viteza sunt esențiale. Dacă aceste modele devin tot mai fiabile, ele ar putea valida decizia Apple și a altor producători de dispozitive de a nu investi sume uriașe în LLM-uri bazate pe cloud.

Piața de cipuri bazate pe inteligență artificială va crește cu 30% pe an până în 2030

AI / Foto: Freepik

Mai mic este mai frumos

Nu există o definiție precisă a ceea ce constituie un model lingvistic mic versus unul mare. Diferența se rezumă la numărul de parametri pe care sunt antrenate modelele — adică setările numerice din „creierul” modelului – care îl ajută să înțeleagă datele. LLM-urile ajung la sute de miliarde de parametri. SLM-urile pot fi antrenate pe 40 de miliarde sau mai puțin, uneori chiar sub 1 miliard în cazul celor foarte mici.

Îmbunătățirile în antrenarea SLM-urilor le-au ajutat să recupereze decalajul față de LLM-uri. Tot mai des, modelele mici sunt „învățate” de cele mari, în loc să fie nevoite să parcurgă singure internetul. Artificial Analysis, o firmă de evaluare, spune că într-o varietate de teste, un model de 9 miliarde de parametri numit Nvidia Nemotron Nano, lansat recent de producătorul de cipuri AI, depășește un model Llama lansat în aprilie de Meta, gigantul social media, care este de 40 de ori mai mare. Recuperarea a devenit rutină. „Modelele mici de azi sunt mult mai capabile decât cele mari de anul trecut”, afirmă Mohit Agrawal de la Counterpoint, o firmă de cercetare de piață în tehnologie.

Performanțele mai bune au atras clienți corporativi

Gartner, o companie de prognoze IT, spune că defectele binecunoscute ale LLM-urilor, precum „halucinațiile”, au creat o „oboseală a utilizatorilor”. În schimb, firmele vor modele mai specializate, antrenate pe date din industrii specifice. Anul acesta, cererea corporativă pentru astfel de modele este estimată să crească de două ori mai rapid decât pentru LLM-uri, chiar dacă de la o bază mai mică. Pe termen lung, Gartner se așteaptă ca tot mai multe dintre aceste modele specializate să fie dezvoltate intern de companii.

Un alt motiv al popularității crescânde a SLM-urilor este economia. Companiile au trecut de la abordarea „cheltuie orice”, din primele zile ale AI generative, la o concentrare mai mare pe rentabilitatea investițiilor.

Deși LLM-urile pot fi în continuare folosite pentru multe sarcini, firmele pot economisi bani folosind SLM-uri pentru joburi discrete și repetitive. După cum spune un mare investitor de capital de risc: ai nevoie de un Boeing 777 ca să zbori de la San Francisco la Beijing, dar nu și de la San Francisco la Los Angeles. „Aplicarea celor mai puternice modele pentru toate problemele nu are sens”, adaugă el.

Granițe în virtual. Ce înseamnă „splinternetul” și cum va schimba lumea pe care o știm / Foto: Shutterstock

Foto: Shutterstock

Modelele mici pot rula și pe tipuri mai ieftine de cipuri

Pentru a ilustra economia, Cox de la IBM menționează un produs al companiei sale, Docling, care transformă documente PDF, precum chitanțele, în date stocabile. Acesta rulează pe un model „minuscul” cu circa 250 de milioane de parametri. El îl numește un instrument util, dar care nu ar fi rentabil dacă ar fi rulat pe un LLM. Modelele mici pot rula și pe tipuri mai ieftine de cipuri. Cele mai mici pot folosi unități centrale de procesare (CPU), „caii de povară” ai informaticii generale. Acestea ar înlocui unitățile grafice (GPU) — cele care au făcut din Nvidia cea mai valoroasă companie din lume. Acesta ar putea fi un argument puternic de vânzare: GPU-urile, spune Cox, sunt „Ferrari-uri pretențioase, mereu în service”.

SLM-urile ar putea deveni și mai atractive, pe măsură ce firmele implementează mai mulți agenți AI. Un articol puțin observat, publicat în iunie de Nvidia Research, afirmă direct că „modelele lingvistice mici, și nu cele mari, sunt viitorul AI-ului agentic”. Articolul notează că, în prezent, majoritatea agenților sunt alimentați de LLM-uri, găzduite de furnizorii de cloud. Investițiile uriașe în infrastructura cloud pentru AI sugerează că piața presupune că LLM-urile vor rămâne motoarele AI-ului agentic. Articolul contestă această presupunere, argumentând că SLM-urile sunt suficient de puternice pentru a gestiona sarcini agentice și mult mai economice.

De exemplu, un model de 7 miliarde de parametri poate fi de 10 până la 30 de ori mai ieftin de rulat decât unul de până la 25 de ori mai mare.

Acesta sugerează că SLM-urile ar putea duce la o abordare de tip „Lego” pentru construirea agenților. Companiile folosesc mici experți specializați, în loc de o singură inteligență LLM monolitică.

Foto: Pixabay.com

Clienții corporativi vor modele „de toate formele și dimensiunile”

Articolul, care ridică întrebări despre banii investiți în infrastructura cloud pentru AI agentic, nu reflectă strategia Nvidia, spune Kari Briski, director executiv al companiei. Clienții corporativi vor modele „de toate formele și dimensiunile”. Cele mai mari modele sunt mai bune la sarcinile cele mai dificile decât cele mici. Mai mult, spune ea, este important să se continue împingerea frontierelor LLM-urilor, deoarece acestea devin profesori mai buni pentru SLM-uri.

Indiferent dacă SLM-urile vor înlocui sau nu LLM-urile, diversitatea este în creștere. LLM-urile „atotștiutoare” vor rămâne importante pentru aplicații de consum, precum ChatGPT al OpenAI. Totuși, chiar și OpenAI își schimbă focusul. GPT-5 conține modele interne de diferite dimensiuni și puteri, pe care le folosește în funcție de complexitatea sarcinii.

Apple pare să fi pierdut cursa

Pe măsură ce SLM-urile devin mai abile, ele ar putea îmbunătăți și reputația AI-ului pe dispozitive. Agrawal de la Counterpoint se așteaptă ca Apple să evidențieze potențialul modelelor mici în cadrul lansării unui iPhone mai subțire, marți. „Apple Intelligence”, produsul AI al companiei, care folosește SLM-uri pentru anumite sarcini direct pe iPhone. Delegă sarcinile mai grele către cloud și asta ar putea fi direcția viitoare. „Nu este vorba că au pierdut trenul”, spune el despre eforturile dezamăgitoare ale Apple în AI până acum. Având în vedere influența companiei, „poate oricând să urce în următorul tren”.

Pentru moment, cea mai mare parte a atenției rămâne pe LLM-uri. Deși giganți cloud precum Microsoft și Google au construit modele extrem de mici, investițiile ar putea merge în centre de date pentru antrenarea și găzduirea celor mai mari modele. Aceasta ar putea fi o viziune discutabilă. Având în vedere meritele relative ale SLM-urilor, abordarea mai lentă a Apple s-ar putea dovedi justificată pe termen lung.

Alte articole importante
România, printre campioanele scumpirilor la carburanți în Uniunea Europeană
România, printre campioanele scumpirilor la carburanți în Uniunea Europeană
România se află printre statele europene care au înregistrat cele mai mari creșteri ale prețurilor la carburanți în ultimul an, potrivit celor mai recente date publicate de Eurostat. Statisticile arată că șoferii români au resimțit una dintre cele mai accentuate majorări ale costurilor pentru alimentarea autovehiculelor, într-un context în care prețurile au urcat în toate […]
Creditele pentru locuințe devin mai accesibile în Europa, iar Bucureștiul urcă spectaculos în clasament
Creditele pentru locuințe devin mai accesibile în Europa, iar Bucureștiul urcă spectaculos în clasament
Reducerea dobânzilor la creditele ipotecare în majoritatea statelor Uniunii Europene începe să se reflecte direct în accesibilitatea locuințelor cumpărate prin finanțare bancară. Un nou raport arată că Bucureștiul a ajuns în topul celor mai accesibile cinci capitale europene pentru achiziția unui apartament prin credit ipotecar, depășind numeroase orașe importante din vestul continentului. Analiza realizată de […]
Gazul, soluție sau capcană? Raportul care critică marile proiecte energetice ale României
Gazul, soluție sau capcană? Raportul care critică marile proiecte energetice ale României
România este menționată alături de Germania și Polonia într-un raport european care avertizează că Uniunea Europeană riscă să își prelungească dependența de combustibilii fosili, în loc să accelereze tranziția către surse regenerabile și tehnologii moderne de stocare a energiei. Investiții în infrastructura de gaze naturale, în ciuda obiectivelor climatice asumate Analiza, realizată de organizația Beyond […]
Investitorii au împins piața la un nou nivel. Bursa de Valori București a adăugat peste 21 de miliarde de lei în doar câteva zile
Investitorii au împins piața la un nou nivel. Bursa de Valori București a adăugat peste 21 de miliarde de lei în doar câteva zile
Bursa de Valori București a încheiat una dintre cele mai bune săptămâni din acest an, cu o creștere semnificativă a valorii companiilor listate și cu noi recorduri pentru principalul indice al pieței. Potrivit datelor oficiale, capitalizarea bursieră a BVB crescut cu peste 21,4 miliarde de lei în intervalul 15-19 iunie 2026, ceea ce reprezintă un […]
Una dintre cele mai mari licitații organizate de stat: active de aproape 3 miliarde de lei ajung pe platforma ANAF
Una dintre cele mai mari licitații organizate de stat: active de aproape 3 miliarde de lei ajung pe platforma ANAF
Autoritățile fiscale au declanșat una dintre cele mai ample operațiuni de valorificare a activelor sechestrate din ultimii ani, după ce CFR Marfă a făcut pași oficiali către procedura de faliment. Miza este uriașă: recuperarea unei părți cât mai consistente din datoriile de peste 1,3 miliarde de lei pe care compania le are către stat. În […]
O amenințare juridică în plin turneu mondial. Spania respinge scenariul confiscării activelor la Cupa Mondială: un fond american vizează dispute vechi de peste un deceniu
Economie mondială
O amenințare juridică în plin turneu mondial. Spania respinge scenariul confiscării activelor la Cupa Mondială: un fond american vizează dispute vechi de peste un deceniu
Autoritățile spaniole resping ferm ideea că active ale Federației Regale Spaniole de Fotbal ar putea fi confiscate în timpul Cupei Mondiale din 2026, pe fondul unei dispute internaționale complexe legate de investiții în energie regenerabilă. Cazul a reaprins tensiuni juridice și economice vechi de peste 10 ani, după ce un fond de investiții din SUA […]