Google a lansat Gemini 2.5 Deep Think, un model avansat de inteligență artificială care poate analiza simultan mai multe idei pentru a oferi răspunsuri mai precise și mai fundamentate.
Această inovație marchează un pas important în dezvoltarea AI-ului capabil să raționeze complex și să abordeze probleme dificile prin gândire paralelă.
Foto: Deepmind.Google
Gigantul tech american îl descrie drept cel mai avansat model AI de raționament, capabil să abordeze întrebările explorând și analizând simultan mai multe idei, pentru a selecta apoi cel mai potrivit răspuns. Abonații serviciului Google Ultra, care costă 250 de dolari lunar, au deja acces la Gemini 2.5 Deep Think prin aplicația Gemini.
Prezentat inițial în luna mai, la evenimentul Google I/O 2025, Gemini 2.5 Deep Think este primul model multi-agent disponibil public de la Google. Acest sistem folosește mai mulți agenți AI care lucrează în paralel pentru a rezolva o problemă, necesitând resurse de calcul mai mari decât un singur agent, dar oferind răspunsuri mai bune. Google a utilizat o versiune a acestui model pentru a câștiga medalia de aur la Olimpiada Internațională de Matematică (IMO) din acest an.
Pe lângă Gemini 2.5 Deep Think, compania va pune la dispoziția unui grup restrâns de matematicieni și cercetători modelul folosit la IMO. Acesta are nevoie de ore pentru a raționa spre deosebire de modelele AI destinate consumatorilor, care oferă răspunsuri în câteva secunde sau minute. Google speră ca modelul IMO să susțină cercetarea academică și să primească feedback pentru îmbunătățirea sistemului multi-agent.
Compania afirmă că Gemini 2.5 Deep Think reprezintă o evoluție semnificativă față de versiunea anunțată la Google I/O, bazându-se pe noi „tehnici de învățare prin consolidare” care optimizează raționamentul modelului. „Deep Think poate ajuta la rezolvarea problemelor ce cer creativitate, planificare strategică și abordare pas cu pas”, a declarat Google într-un comunicat citat de TechCrunch.
Gemini 2.5 Deep Think a obținut performanțe de top la Humanity’s Last Exam (HLE), care este un test ce măsoară capacitatea AI de a răspunde la mii de întrebări din matematică, științe umaniste și exacte. Modelul a înregistrat un scor de 34,8% (fără instrumente), depășind Grok 4 de la xAI (25,4%) și o3 de la OpenAI (20,3%). De asemenea, Gemini 2.5 Deep Think a obținut rezultate superioare la LiveCodeBench 6, un test de codare competitivă, cu un scor de 87,6%, față de Grok 4 (79%) și o3 (72%).
Modelul funcționează automat cu instrumente precum execuția de cod și Google Search și poate genera răspunsuri mult mai ample decât modelele AI obișnuite. În teste, Gemini 2.5 Deep Think a creat sarcini de dezvoltare web mai detaliate și estetic plăcute comparativ cu alte AI-uri, fiind considerat un potențial sprijin important pentru cercetători și accelerarea descoperirilor.
Tot mai multe laboratoare de top dezvoltă modele multi-agent. De exemplu, xAI, compania lui Elon Musk, a lansat recent Grok 4 Heavy, un sistem multi-agent cu performanțe de vârf. Cercetătorul OpenAI Noam Brown a declarat că modelul folosit de OpenAI pentru medalia de aur la IMO a fost și el un sistem multi-agent. Anthropic folosește, de asemenea, un sistem multi-agent pentru agentul său de cercetare.
Deși puternice, sistemele multi-agent sunt și mult mai costisitoare, ceea ce face ca accesul să fie limitat prin abonamente scumpe, cum procedează xAI și Google. În următoarele săptămâni, Google va oferi acces la Gemini 2.5 Deep Think unui grup restrâns de testeri prin API-ul Gemini, urmărind să înțeleagă mai bine utilizările practice ale sistemului multi-agent în dezvoltare și afaceri.