Prima pagină » DeepSeek lansează un model care promite eficiență la jumătate de cost

DeepSeek lansează un model care promite eficiență la jumătate de cost

DeepSeek lansează un model care promite eficiență la jumătate de cost
sursă foto: Reuters

Startup-ul chinezesc DeepSeek a zguduit din nou industria inteligenței artificiale, prezentând un nou model experimental ce promite eficiență sporită, costuri reduse și performanțe surprinzătoare. Totuși, specialiștii avertizează că arhitectura aduce și riscuri majore pentru siguranța și fiabilitatea tehnologiei.

DeepSeek, rivalul surpriză al giganților americani

China a intrat în forță în cursa globală pentru inteligența artificială. Startup-ul DeepSeek, necunoscut publicului larg până anul trecut, a reușit să stârnească o adevărată furtună în Silicon Valley după lansarea modelului R1.

Atunci, compania a demonstrat că se pot antrena modele lingvistice mari (LLM) rapid, cu resurse mai reduse și pe cipuri mai puțin puternice, contrazicând modelul clasic de dezvoltare urmat de giganții americani precum OpenAI sau Google.

Luni, DeepSeek a anunțat lansarea DeepSeek-V3.2-Exp, o versiune experimentală a actualului model V3.1-Terminus. Compania a publicat detaliile tehnice pe platforma Hugging Face, iar vestea a atras imediat atenția comunității internaționale de cercetare.

Noul sistem promite să ducă mai departe misiunea startup-ului: eficiență crescută, reducerea costurilor și partajarea tehnologiei în regim open-source.

„Sparse Attention”, inovația care schimbă regulile jocului

Adina Yakefu, lider al comunității chineze Hugging Face, a declarat pentru CNBC că marea noutate adusă de V3.2 este o funcționalitate denumită „DSA – DeepSeek Sparse Attention”.

Această arhitectură permite modelului să proceseze mai bine documente lungi și conversații complexe, reducând în același timp costurile de rulare cu aproximativ 50% față de versiunea anterioară.

Este semnificativ pentru că oferă viteza și eficiența dorită, fără o scădere vizibilă a performanței”, a subliniat și Nick Patience, vicepreședinte și expert AI la The Futurum Group.

Potrivit acestuia, noua tehnologie poate face ca puterea AI să devină accesibilă și pentru companii mici sau cercetători independenți, deschizând drumul către aplicații inovatoare.

Cum funcționează Sparse Attention

Modelele AI iau decizii pe baza datelor de antrenament și a informațiilor noi introduse de utilizatori. Sparse attention presupune că algoritmul filtrează datele și ia în calcul doar ceea ce consideră esențial pentru rezolvarea unei sarcini.

Spre exemplu, dacă o companie aeriană vrea să stabilească cea mai bună rută între două destinații, modelul clasic ar analiza toate variantele posibile, consumând timp și resurse. Sparse attention, în schimb, elimină opțiunile nerelevante și se concentrează pe traseele viabile, reducând astfel costurile și accelerând procesul.

Ekaterina Almasque, cofondatoare a fondului BlankPage Capital, a explicat: „Practic, tai din start informațiile considerate neimportante. Astfel, economisești resurse și obții eficiență mai mare.”

Avantaje și capcane ale noii arhitecturi

Pe hârtie, Sparse Attention pare soluția ideală pentru a face modelele AI mai rapide și mai puțin costisitoare. Totuși, investitorii și cercetătorii avertizează că metoda are și dezavantaje serioase.

Realitatea este că aceste modele pierd multe nuanțe. Problema este dacă mecanismul știe cu adevărat ce date să excludă. Dacă elimină informații importante, rezultatul final devine irelevant”, a spus Almasque, cunoscută pentru investițiile timpurii în companii precum Darktrace sau Graphcore.

Această limitare poate ridica riscuri semnificative pentru siguranța și corectitudinea modelelor AI. Excluderea unor date esențiale ar putea duce la erori periculoase, mai ales în aplicații critice precum medicină, finanțe sau transport.

Impactul asupra accesibilității AI

Chiar și cu aceste riscuri, specialiștii recunosc potențialul uriaș al noii tehnologii. Reducerea costurilor de operare cu până la 50% ar putea democratiza accesul la AI.

Dacă până acum doar giganții din tehnologie își permiteau să ruleze modele complexe, noua abordare ar putea permite și startup-urilor sau universităților să dezvolte aplicații competitive.

Alte articole importante
UE împrumută modelul industrial al Chinei și riscă să alunge investitorii
Companii
UE împrumută modelul industrial al Chinei și riscă să alunge investitorii
Uniunea Europeană se află în pragul unei schimbări majore de strategie industrială, inspirată direct din modelul aplicat de China în ultimele decenii. Comisia Europeană ia în calcul introducerea unor reguli care ar obliga companiile străine să intre în parteneriate cu firme europene pentru a avea acces la piața comunitară, o abordare care riscă să tensioneze […]
DECLARAȚII EXCLUSIVE
Marian Siminică, Institutul de Studii Financiare: „Creșterea economică peste un anumit plafon e condiționată de nivelul de educație financiară”
Marian Siminică, Institutul de Studii Financiare: „Creșterea economică peste un anumit plafon e condiționată de nivelul de educație financiară”
Creșterea economică nu depinde doar de investiții, capital sau politici fiscale. Depinde, în mod direct, de nivelul de alfabetizare financiară a populației. Afirmația se bazează pe studii la nivel internațional care demonstrează o legătură extrem de puternică între nivelul de educație financiară a populației și performanța economiei, explică Prof. univ. dr. Marian Siminică, director executiv […]
Big Brother-ul fiscal devine realitate: ANAF primește acces la baza de date unică a UE, iar marile grupuri intră sub lupa transparenței totale
Companii
Big Brother-ul fiscal devine realitate: ANAF primește acces la baza de date unică a UE, iar marile grupuri intră sub lupa transparenței totale
România face un pas decisiv către cea mai amplă reformă de transparență fiscală din ultimii ani, odată cu transpunerea Directivei (UE) 2025/872, cunoscută la nivel european sub denumirea DAC9. Ministerul Finanțelor a elaborat un proiect de act normativ care schimbă fundamental modul în care marile grupuri de companii își declară profiturile și își raportează obligațiile […]
Franklin Templeton duce Fondul Proprietatea la randamente istorice: 1.340% câștig pentru acționari
Franklin Templeton duce Fondul Proprietatea la randamente istorice: 1.340% câștig pentru acționari
Strategia aplicată de Franklin Templeton în administrarea Fondului Proprietatea a generat un randament total de 1.340% pentru prețul acțiunilor și de 494% pentru valoarea activului net, de la începutul calculului performanței și până la 31 decembrie 2025. Datele sunt prezentate într-un comunicat al companiei, care evidențiază evoluția Fondului într-un context marcat de volatilitate globală și […]
Cel mai nou model ChatGPT folosește acum date din Grokipedia
Companii
Cel mai nou model ChatGPT folosește acum date din Grokipedia
ChatGPT a început să integreze informații din Grokipedia în răspunsuri, oferind utilizatorilor acces la date suplimentare și actualizate. Cel mai recent model al chatbot-ului OpenAI a început să citeze enciclopedia lui Elon Musk ca sursă pentru o gamă largă de întrebări. Această schimbare promite să îmbunătățească acuratețea și contextul informațiilor furnizate de asistentul AI. Cel […]
ANALIZĂ
Viitorul model Dacia derivat din Twingo va fi creat integral în China
Companii
Viitorul model Dacia derivat din Twingo va fi creat integral în China
Unul dintre viitoarele modele Dacia, care va fi derivat din Renault Twingo, va fi dezvoltat la centrul tehnologic Ampere din Shanghai. Ciclul de dezvoltare de la stadiul de concept până la cel de versiune de serie este de doar 16 luni. Renault își propune să devină mai competitiv în fața mărcilor chinezești care se impun […]