Prima pagină » Credința în zeii AI atotștiutori a intrat în declin

Credința în zeii AI atotștiutori a intrat în declin

Credința în zeii AI atotștiutori a intrat în declin
Credința în zeii AI atotștiutori a intrat în declin

Deși LLM impresionează prin versatilitate, companiile migrează spre SLM, mai ieftine, eficiente și ușor de adaptat nevoilor specifice.

Când se vorbește despre progresul modelelor lingvistice de mari dimensiuni (LLM), cea mai la îndemână analogie este cu smartphone-urile. Primele zile ale lui ChatGPT au fost la fel de revoluționare ca lansarea iPhone-ului de la Apple, în 2007. Dar avansurile inteligenței artificiale au început să semene mai degrabă cu actualizări banale de telefoane.
GPT-5, cel mai recent model al OpenAI, este un exemplu. A stârnit mai puțin entuziasm decât iPhone 17, care urmează să fie prezentat pe 9 septembrie, se arată într-o analiză The Economist.

Modelele mai mici și mai agile câștigă teren în mediul corporativ

Ritmul încetinit al progreselor în inteligența artificială generativă de ultimă generație este un semn că LLM-urile nu prea își îndeplinesc promisiunile, comentează sursa citatată. Declinul aparent ar putea fi explicat prin ascensiunea alternativelor mai mici și mai agile, care câștigă teren în mediul corporativ. Multe companii preferă modele personalizate, adaptate nevoilor lor specifice. Aceste așa-numite modele lingvistice mici (SLM) sunt mai ieftine decât LLM-urile universale, a căror inteligență, „asemănătoare cu cea a unui zeu”, poate părea, uneori, inutilă. „Chatbotul de resurse umane nu are nevoie să știe fizică avansată”, explică David Cox, șeful cercetării în domeniul modelelor AI la IBM.

Pe lângă faptul că sunt la fel de ușor de rulat pe infrastructura IT internă a unei companii, ca și prin furnizori de servicii cloud, SLM-urile pot fi chiar mai utile pentru agenții AI, care efectuează sarcini de muncă alături sau în locul oamenilor. Dimensiunea lor mai mică le face deosebit de potrivite pentru smartphone-uri, mașini autonome, roboți și alte dispozitive – unde eficiența energetică și viteza sunt esențiale. Dacă aceste modele devin tot mai fiabile, ele ar putea valida decizia Apple și a altor producători de dispozitive de a nu investi sume uriașe în LLM-uri bazate pe cloud.

Piața de cipuri bazate pe inteligență artificială va crește cu 30% pe an până în 2030

AI / Foto: Freepik

Mai mic este mai frumos

Nu există o definiție precisă a ceea ce constituie un model lingvistic mic versus unul mare. Diferența se rezumă la numărul de parametri pe care sunt antrenate modelele — adică setările numerice din „creierul” modelului – care îl ajută să înțeleagă datele. LLM-urile ajung la sute de miliarde de parametri. SLM-urile pot fi antrenate pe 40 de miliarde sau mai puțin, uneori chiar sub 1 miliard în cazul celor foarte mici.

Îmbunătățirile în antrenarea SLM-urilor le-au ajutat să recupereze decalajul față de LLM-uri. Tot mai des, modelele mici sunt „învățate” de cele mari, în loc să fie nevoite să parcurgă singure internetul. Artificial Analysis, o firmă de evaluare, spune că într-o varietate de teste, un model de 9 miliarde de parametri numit Nvidia Nemotron Nano, lansat recent de producătorul de cipuri AI, depășește un model Llama lansat în aprilie de Meta, gigantul social media, care este de 40 de ori mai mare. Recuperarea a devenit rutină. „Modelele mici de azi sunt mult mai capabile decât cele mari de anul trecut”, afirmă Mohit Agrawal de la Counterpoint, o firmă de cercetare de piață în tehnologie.

Performanțele mai bune au atras clienți corporativi

Gartner, o companie de prognoze IT, spune că defectele binecunoscute ale LLM-urilor, precum „halucinațiile”, au creat o „oboseală a utilizatorilor”. În schimb, firmele vor modele mai specializate, antrenate pe date din industrii specifice. Anul acesta, cererea corporativă pentru astfel de modele este estimată să crească de două ori mai rapid decât pentru LLM-uri, chiar dacă de la o bază mai mică. Pe termen lung, Gartner se așteaptă ca tot mai multe dintre aceste modele specializate să fie dezvoltate intern de companii.

Un alt motiv al popularității crescânde a SLM-urilor este economia. Companiile au trecut de la abordarea „cheltuie orice”, din primele zile ale AI generative, la o concentrare mai mare pe rentabilitatea investițiilor.

Deși LLM-urile pot fi în continuare folosite pentru multe sarcini, firmele pot economisi bani folosind SLM-uri pentru joburi discrete și repetitive. După cum spune un mare investitor de capital de risc: ai nevoie de un Boeing 777 ca să zbori de la San Francisco la Beijing, dar nu și de la San Francisco la Los Angeles. „Aplicarea celor mai puternice modele pentru toate problemele nu are sens”, adaugă el.

Granițe în virtual. Ce înseamnă „splinternetul” și cum va schimba lumea pe care o știm / Foto: Shutterstock

Foto: Shutterstock

Modelele mici pot rula și pe tipuri mai ieftine de cipuri

Pentru a ilustra economia, Cox de la IBM menționează un produs al companiei sale, Docling, care transformă documente PDF, precum chitanțele, în date stocabile. Acesta rulează pe un model „minuscul” cu circa 250 de milioane de parametri. El îl numește un instrument util, dar care nu ar fi rentabil dacă ar fi rulat pe un LLM. Modelele mici pot rula și pe tipuri mai ieftine de cipuri. Cele mai mici pot folosi unități centrale de procesare (CPU), „caii de povară” ai informaticii generale. Acestea ar înlocui unitățile grafice (GPU) — cele care au făcut din Nvidia cea mai valoroasă companie din lume. Acesta ar putea fi un argument puternic de vânzare: GPU-urile, spune Cox, sunt „Ferrari-uri pretențioase, mereu în service”.

SLM-urile ar putea deveni și mai atractive, pe măsură ce firmele implementează mai mulți agenți AI. Un articol puțin observat, publicat în iunie de Nvidia Research, afirmă direct că „modelele lingvistice mici, și nu cele mari, sunt viitorul AI-ului agentic”. Articolul notează că, în prezent, majoritatea agenților sunt alimentați de LLM-uri, găzduite de furnizorii de cloud. Investițiile uriașe în infrastructura cloud pentru AI sugerează că piața presupune că LLM-urile vor rămâne motoarele AI-ului agentic. Articolul contestă această presupunere, argumentând că SLM-urile sunt suficient de puternice pentru a gestiona sarcini agentice și mult mai economice.

De exemplu, un model de 7 miliarde de parametri poate fi de 10 până la 30 de ori mai ieftin de rulat decât unul de până la 25 de ori mai mare.

Acesta sugerează că SLM-urile ar putea duce la o abordare de tip „Lego” pentru construirea agenților. Companiile folosesc mici experți specializați, în loc de o singură inteligență LLM monolitică.

Foto: Pixabay.com

Clienții corporativi vor modele „de toate formele și dimensiunile”

Articolul, care ridică întrebări despre banii investiți în infrastructura cloud pentru AI agentic, nu reflectă strategia Nvidia, spune Kari Briski, director executiv al companiei. Clienții corporativi vor modele „de toate formele și dimensiunile”. Cele mai mari modele sunt mai bune la sarcinile cele mai dificile decât cele mici. Mai mult, spune ea, este important să se continue împingerea frontierelor LLM-urilor, deoarece acestea devin profesori mai buni pentru SLM-uri.

Indiferent dacă SLM-urile vor înlocui sau nu LLM-urile, diversitatea este în creștere. LLM-urile „atotștiutoare” vor rămâne importante pentru aplicații de consum, precum ChatGPT al OpenAI. Totuși, chiar și OpenAI își schimbă focusul. GPT-5 conține modele interne de diferite dimensiuni și puteri, pe care le folosește în funcție de complexitatea sarcinii.

Apple pare să fi pierdut cursa

Pe măsură ce SLM-urile devin mai abile, ele ar putea îmbunătăți și reputația AI-ului pe dispozitive. Agrawal de la Counterpoint se așteaptă ca Apple să evidențieze potențialul modelelor mici în cadrul lansării unui iPhone mai subțire, marți. „Apple Intelligence”, produsul AI al companiei, care folosește SLM-uri pentru anumite sarcini direct pe iPhone. Delegă sarcinile mai grele către cloud și asta ar putea fi direcția viitoare. „Nu este vorba că au pierdut trenul”, spune el despre eforturile dezamăgitoare ale Apple în AI până acum. Având în vedere influența companiei, „poate oricând să urce în următorul tren”.

Pentru moment, cea mai mare parte a atenției rămâne pe LLM-uri. Deși giganți cloud precum Microsoft și Google au construit modele extrem de mici, investițiile ar putea merge în centre de date pentru antrenarea și găzduirea celor mai mari modele. Aceasta ar putea fi o viziune discutabilă. Având în vedere meritele relative ale SLM-urilor, abordarea mai lentă a Apple s-ar putea dovedi justificată pe termen lung.

Alte articole importante
Românii pot investi din nou în titlurile de stat Fidelis. Dobânzile ajung la 7,5% în lei și 6,25% în euro
Românii pot investi din nou în titlurile de stat Fidelis. Dobânzile ajung la 7,5% în lei și 6,25% în euro
Ministerul Finanțelor lansează o nouă ediție a programului Fidelis, prin care persoanele fizice rezidente și nerezidente pot investi în titluri de stat denominate în lei și euro. Noua emisiune începe vineri, 8 mai, și se va desfășura până pe 15 mai, oferind dobânzi care ajung până la 7,5% pentru titlurile în lei și până la […]
Zi decisivă pentru viitorul Șantierului Naval Mangalia. Rheinmetall și MSC vor să transforme platforma într-un centru strategic european
Companii
Zi decisivă pentru viitorul Șantierului Naval Mangalia. Rheinmetall și MSC vor să transforme platforma într-un centru strategic european
Viitorul celui mai mare șantier naval din România se decide într-un moment critic pentru industria navală și de apărare de la Marea Neagră. Creditorii Damen Shipyards Mangalia sunt chemați vineri să aprobe strategia de valorificare a companiei aflate în faliment, într-o procedură care poate deschide drumul către una dintre cele mai importante investiții industriale din […]
Commerzbank anunță concedieri și ținte financiare mai ambițioase pentru a bloca preluarea de către UniCredit
Commerzbank anunță concedieri și ținte financiare mai ambițioase pentru a bloca preluarea de către UniCredit
Grupul bancar german Commerzbank a anunțat un nou plan de restructurare care include reducerea a aproximativ 3.000 de locuri de muncă și creșterea obiectivelor de profitabilitate până în 2028, într-o mișcare menită să întărească poziția băncii în fața tentativei de preluare venite din partea UniCredit. Anunțul a fost făcut vineri, după ce grupul italian UniCredit […]
Dezvăluiri explozive în procesul OpenAI: Elon Musk ar fi vrut control total pentru a finanța colonizarea planetei Marte
Tehnologie
Dezvăluiri explozive în procesul OpenAI: Elon Musk ar fi vrut control total pentru a finanța colonizarea planetei Marte
Un proces cu implicații uriașe pentru viitorul inteligenței artificiale scoate la iveală detalii spectaculoase despre planurile unuia dintre cei mai influenți antreprenori din lume. În cadrul audierilor din California, Greg Brockman, președintele OpenAI, a declarat că Elon Musk ar fi dorit control total asupra organizației pentru a putea strânge aproximativ 80 de miliarde de dolari […]
Bursa de la București continuă să crească după căderea Guvernului. Investitorii văd „o ușurare”, iar leul recuperează timid
Bursa de la București continuă să crească după căderea Guvernului. Investitorii văd „o ușurare”, iar leul recuperează timid
Piața de capital din România a continuat să crească pentru a treia ședință consecutiv după demiterea Guvernului Bolojan, într-un context în care investitorii par să privească schimbările politice mai degrabă ca pe o resetare necesară decât ca pe un motiv de panică. În paralel, moneda națională a avut o apreciere simbolică în raport cu euro, […]
Bursele europene au explodat după semnalele de pace dintre SUA și Iran. Investitorii pariază pe sfârșitul tensiunilor din Orientul Mijlociu
Bursele europene au explodat după semnalele de pace dintre SUA și Iran. Investitorii pariază pe sfârșitul tensiunilor din Orientul Mijlociu
Piețele financiare europene au avut miercuri una dintre cele mai bune ședințe din ultimele luni, după apariția informațiilor potrivit cărora Statele Unite și Iranul sunt aproape de un acord care ar putea reduce semnificativ tensiunile din Orientul Mijlociu. Investitorii au reacționat imediat, iar marile burse de pe continent au închis pe creștere puternică. Optimismul a […]