Prima pagină » DeepSeek zguduie tech-ul: cât costă antrenarea unui AI

DeepSeek zguduie tech-ul: cât costă antrenarea unui AI

DeepSeek zguduie tech-ul: cât costă antrenarea unui AI
sursă foto: Getty Images

Compania chineză DeepSeek a dezvăluit că antrenarea modelului său R1 a costat doar 294.000 de dolari. Această sumă este mult sub investițiile uriașe ale rivalilor americani.

DeepSeek dezvăluie costurile surprinzător de mici pentru un model de top

Dezvoltatorul chinez de inteligență artificială DeepSeek a publicat, pentru prima dată, detalii despre costurile reale de antrenare a modelului său R1. Conform unui articol apărut miercuri în revista academică Nature, suma totală a fost de doar 294.000 de dolari. Această valoare contrastează puternic cu estimările din SUA. Liderii din domeniu, precum OpenAI, au menționat sume care depășesc 100 de milioane de dolari pentru antrenarea modelelor fundamentale.

Articolul, care îl are coautor pe fondatorul Liang Wenfeng, a adus din nou DeepSeek în atenția publică. Compania, cu sediul în Hangzhou, a atras atenția încă din ianuarie, când a lansat sisteme AI considerate mai ieftine și eficiente decât cele ale rivalilor americani. Atunci, mișcarea a dus la o scădere masivă a acțiunilor companiilor de tehnologie la nivel global. Acest lucru s-a întâmplat din cauza temerilor privind pierderea dominației de către Nvidia și alți giganți.

Cum a fost antrenat modelul R1 al DeepSeek

Datele publicate de DeepSeek arată că modelul R1, specializat în raționament și logică, a fost antrenat timp de 80 de ore. Pentru acest lucru s-a folosit un cluster format din 512 cipuri Nvidia H800. Aceste cipuri au fost create special pentru piața chineză după ce SUA au interzis exportul modelelor mai performante H100 și A100, scrie CNN.

Deși în articolul inițial, publicat în ianuarie, aceste informații nu apăreau, acum compania a recunoscut și utilizarea unor cipuri A100. Acestea au fost folosite doar în fazele pregătitoare, pentru teste cu modele mai mici. Ulterior s-a trecut la infrastructura bazată pe H800.

Această transparență vine după luni de speculații și acuzații. În iunie, oficiali americani au afirmat că DeepSeek ar fi avut acces la cantități mari de cipuri H100, în ciuda sancțiunilor. Nvidia a confirmat însă că firma chineză a folosit legal doar cipuri H800. În documentele suplimentare atașate articolului din Nature, compania a recunoscut că deține și A100, dar a insistat că acestea au fost utilizate doar limitat.

Suspiciuni și acuzații de „distilare”

O altă controversă majoră privește tehnicile folosite de DeepSeek pentru a dezvolta modelele sale. În ianuarie, un consilier al Casei Albe și mai multe voci din industria americană au acuzat compania chineză. Ei au afirmat că s-a recurs la „distilarea” modelelor OpenAI.

Distilarea este o tehnică prin care un model AI nou „învață” din rezultatele generate de un alt model, reducând costurile și timpul de antrenare. Practic, se transferă indirect o parte din cunoștințele acumulate de un model anterior fără a repeta procesul complet de procesare.

DeepSeek a răspuns că această metodă este legitimă și că, prin distilare, modelele devin mai performante la costuri mult mai mici. Compania a confirmat că a folosit și modelul open-source Llama, dezvoltat de Meta, ca bază pentru unele dintre propriile sisteme.

În studiul din Nature, cercetătorii au admis că modelul V3 al DeepSeek a fost antrenat pe date web care conțineau și răspunsuri generate de modele OpenAI. Totuși, au precizat că aceasta a fost o situație incidentală și nu o strategie intenționată.

Alte articole importante
Studiu BCE: europenii evită produsele americane
Studiu BCE: europenii evită produsele americane
Un studiu al BCE arată cum gospodăriile din zona euro au început să evite produsele americane. Totodată, aceștia își reduc din ce în ce mai mult cheltuielile, pe fondul incertitudinii privind tarifele comerciale impuse de SUA. BCE: Europenii își schimbă obiceiurile de consum Banca Centrală Europeană (BCE) a publicat un studiu alarmant care arată că tensiunile […]
Negocieri pentru TikTok: SUA primește aplicația, China își menține avantajul tehnologic
Negocieri pentru TikTok: SUA primește aplicația, China își menține avantajul tehnologic
Acordul propus prevede ca ByteDance, compania chineză care deține platforma TikTok, să păstreze mai puțin de 20% din acțiuni. Operațiunile din SUA ar putea fi achiziționate de un consorțiu – care include gigantul tehnologic Oracle – și de firmele de investiții Andreessen Horowitz și Silver Lake. Negocierile pentru TikTok se fac la cel mai înalt […]
Brandurile de lux pompează bani ca să descifreze mintea Generației Z
Analize
Brandurile de lux pompează bani ca să descifreze mintea Generației Z
Brandurile de lux investesc masiv pentru a înțelege preferințele Generației Z, care până în 2030 va reprezenta un sfert din consumul global de produse premium. Aceste constatări sunt conform Boston Consulting Group. Înainte de pandemie, această generație acoperea doar 4% din piața de lux. În mai puțin de un deceniu, ponderea va crește la 25%, […]
ANALIZĂ
Ești dependent de tranzacții? Te-ai putea trezi cu datorii de șase cifre!
Ești dependent de tranzacții? Te-ai putea trezi cu datorii de șase cifre!
Ești dependent de tranzacții? Un fost astfel de investitor, care a tranzacționat zilnic – timp de 12 ani, a acumulat datorii de șase cifre înainte de a căuta ajutor. Milioane de oameni pariază, puțini obțin profituri Business Insider publică mărturia lui Chris Gawor, un fost executiv de vânzări din Marea Britanie, care a fost dependent […]
Veneția reintroduce taxa de acces pentru turiști din 2026
Veneția reintroduce taxa de acces pentru turiști din 2026
Veneția va reintroduce în 2026 taxa de acces pentru turiști pentru a gestiona fluxul uriaș de vizitatori și proteja patrimoniul orașului. Autoritățile speră că această taxă va contribui la finanțarea întreținerii infrastructurii și la conservarea atracțiilor turistice istorice. Taxa de acces revine la Veneția pentru a proteja patrimoniul istoric Consiliul local al orașului italian a […]
Franța și Vaticanul au salvat comori arheologice din Gaza înaintea bombardamentelor
Franța și Vaticanul au salvat comori arheologice din Gaza înaintea bombardamentelor
O întârziere a bombardamentelor le-a permis experților să salveze unele artefacte în Gaza, dar arheologii avertizează asupra pierderilor culturale masive. Zona are o istorie de milenii, cu culturi variate: canaanită, egipteană, romană, bizantină, otomană și britanică Clădirea Al‑Kawthar din Gaza City adăpostea depozitul EBAF al Școlii Biblice și Arheologice Franceze, cu artefacte valoroase, a fost […]