Prima pagină » DeepSeek zguduie tech-ul: cât costă antrenarea unui AI

DeepSeek zguduie tech-ul: cât costă antrenarea unui AI

DeepSeek zguduie tech-ul: cât costă antrenarea unui AI
sursă foto: Getty Images

Compania chineză DeepSeek a dezvăluit că antrenarea modelului său R1 a costat doar 294.000 de dolari. Această sumă este mult sub investițiile uriașe ale rivalilor americani.

DeepSeek dezvăluie costurile surprinzător de mici pentru un model de top

Dezvoltatorul chinez de inteligență artificială DeepSeek a publicat, pentru prima dată, detalii despre costurile reale de antrenare a modelului său R1. Conform unui articol apărut miercuri în revista academică Nature, suma totală a fost de doar 294.000 de dolari. Această valoare contrastează puternic cu estimările din SUA. Liderii din domeniu, precum OpenAI, au menționat sume care depășesc 100 de milioane de dolari pentru antrenarea modelelor fundamentale.

Articolul, care îl are coautor pe fondatorul Liang Wenfeng, a adus din nou DeepSeek în atenția publică. Compania, cu sediul în Hangzhou, a atras atenția încă din ianuarie, când a lansat sisteme AI considerate mai ieftine și eficiente decât cele ale rivalilor americani. Atunci, mișcarea a dus la o scădere masivă a acțiunilor companiilor de tehnologie la nivel global. Acest lucru s-a întâmplat din cauza temerilor privind pierderea dominației de către Nvidia și alți giganți.

Cum a fost antrenat modelul R1 al DeepSeek

Datele publicate de DeepSeek arată că modelul R1, specializat în raționament și logică, a fost antrenat timp de 80 de ore. Pentru acest lucru s-a folosit un cluster format din 512 cipuri Nvidia H800. Aceste cipuri au fost create special pentru piața chineză după ce SUA au interzis exportul modelelor mai performante H100 și A100, scrie CNN.

Deși în articolul inițial, publicat în ianuarie, aceste informații nu apăreau, acum compania a recunoscut și utilizarea unor cipuri A100. Acestea au fost folosite doar în fazele pregătitoare, pentru teste cu modele mai mici. Ulterior s-a trecut la infrastructura bazată pe H800.

Această transparență vine după luni de speculații și acuzații. În iunie, oficiali americani au afirmat că DeepSeek ar fi avut acces la cantități mari de cipuri H100, în ciuda sancțiunilor. Nvidia a confirmat însă că firma chineză a folosit legal doar cipuri H800. În documentele suplimentare atașate articolului din Nature, compania a recunoscut că deține și A100, dar a insistat că acestea au fost utilizate doar limitat.

Suspiciuni și acuzații de „distilare”

O altă controversă majoră privește tehnicile folosite de DeepSeek pentru a dezvolta modelele sale. În ianuarie, un consilier al Casei Albe și mai multe voci din industria americană au acuzat compania chineză. Ei au afirmat că s-a recurs la „distilarea” modelelor OpenAI.

Distilarea este o tehnică prin care un model AI nou „învață” din rezultatele generate de un alt model, reducând costurile și timpul de antrenare. Practic, se transferă indirect o parte din cunoștințele acumulate de un model anterior fără a repeta procesul complet de procesare.

DeepSeek a răspuns că această metodă este legitimă și că, prin distilare, modelele devin mai performante la costuri mult mai mici. Compania a confirmat că a folosit și modelul open-source Llama, dezvoltat de Meta, ca bază pentru unele dintre propriile sisteme.

În studiul din Nature, cercetătorii au admis că modelul V3 al DeepSeek a fost antrenat pe date web care conțineau și răspunsuri generate de modele OpenAI. Totuși, au precizat că aceasta a fost o situație incidentală și nu o strategie intenționată.

Alte articole importante
Lukoil pierde miliarde după sancțiunile SUA. Valoarea de piață a scăzut cu 4,6% într-o singură zi
Lukoil pierde miliarde după sancțiunile SUA. Valoarea de piață a scăzut cu 4,6% într-o singură zi
Lukoil pierde din valoare pentru a patra săptămână consecutivă pe Bursa de la Moscova. Acțiunile companiei s-au depreciat puternic după impunerea sancțiunilor americane și blocarea vânzării activelor internaționale. Miercuri, titlurile Lukoil au ajuns la 4.900 de ruble pe acțiune, cel mai scăzut nivel din ultimii doi ani și jumătate. Valoarea de piață a companiei a […]
Care este viitorul Lukoil în România. Nicușor Dan a venit cu informații esențiale
Care este viitorul Lukoil în România. Nicușor Dan a venit cu informații esențiale
Președintele României, Nicușor Dan, a declarat că situația Lukoil în România este atent monitorizată de un grup guvernamental special. El a subliniat că scenariile privind o posibilă preluare a companiei sunt analizate cu atenție. Întrebat despre discuții oficiale cu Guvernul, șeful statului a explicat că primește informații constant de la echipa tehnică responsabilă de monitorizarea […]
Un pod gigant s-a prăbușit la câteva luni de la inaugurare. 1,3 milioane de dolari transformați instant în ruine
Un pod gigant s-a prăbușit la câteva luni de la inaugurare. 1,3 milioane de dolari transformați instant în ruine
Un pod prăbușit a provocat haos în provincia Sichuan, China. Podul Hongqi, inaugurat recent, s-a surpat marți, aruncând bucăți de beton și nori de praf pe versanții munților și în apa de dedesubt. Filmări cu momentul dezastrului au fost distribuite masiv pe rețelele sociale chineze. Autoritățile anunțaseră luni închiderea podului de 758 de metri, după […]
Zboruri Ryanair doar cu telefonul. Biletul de avion va deveni istorie
Zboruri Ryanair doar cu telefonul. Biletul de avion va deveni istorie
Pasagerii care aleg zborurile Ryanair trebuie să aibă biletul exclusiv în format digital. Compania a eliminat complet opțiunea de îmbarcare pe bază de bilet tipărit. Fără aplicația „myRyanair”, procesul devine costisitor. Aceasta este prima etapă a transformării companiei în ceea ce CEO-ul Michael O’Leary descrie drept „prima companie aeriană complet fără hârtie din lume”. Aplicația […]
Europa se pregătește să devină „fabrica de deep tech” a lumii: investiții de 1 trilion de dolari și un milion de locuri de muncă până în 2030
Tehnologie
Europa se pregătește să devină „fabrica de deep tech” a lumii: investiții de 1 trilion de dolari și un milion de locuri de muncă până în 2030
Un nou raport McKinsey & Company arată că Europa are potențialul de a deveni lider global în domeniul deep tech, dacă va investi strategic în inteligență artificială, robotică, biotehnologie și apărare. Specialiștii estimează o valoare economică de 1 trilion de dolari și peste un milion de locuri de muncă noi până la sfârșitul deceniului. Europa, […]
STUDIU. Cum ți se modifică veniturile ca urmare a unei relații cu șeful
STUDIU. Cum ți se modifică veniturile ca urmare a unei relații cu șeful
Reality show-ul „Selling Sunset” are succes pe Netflix tocmai pentru că speculează o temă care ne preocupă, într-un fel sau altul, pe toți. Un grup de agenți imobiliari se plimbă pe dealurile din Hollywood, concurând pentru listările cele mai profitabile. Tensiunile apar atunci când o agentă obține o proprietate excelentă, succes pe care i-l datorează […]