Google a anunțat lansarea unei versiuni extinse și „reimaginată” a agentului său de cercetare Gemini Deep Research.
Aceasta este bazată pe modelul fundamental Gemini 3 Pro, considerat de gigantul tech cel mai avansat și factual model AI dezvoltat până acum.
:format(webp):quality(80)/https://www.putereafinanciara.ro/wp-content/uploads/2025/06/shutterstock_2403254291-scaled.jpg)
Foto: Shutterstock
Noua versiune Gemini Deep Research nu se limitează la generarea de rapoarte de cercetare. Google a introdus Interactions API, care permite integrarea directă a agentului în aplicațiile dezvoltatorilor. Astfel, oferă un control mai mare asupra modului în care interacționează agenții AI. Această schimbare răspunde tendinței tot mai accentuate a sistemelor agentice de a funcționa autonom, transmite TechCrunch.
Potrivit Google, Gemini Deep Research poate analiza și sintetiza volume mari de informații, gestionând prompturi cu context extins. Soluția este deja utilizată pentru activități precum due diligence, analiza de date complexe și cercetări privind siguranța toxicologică a medicamentelor.
Compania americană intenționează să integreze agentul în mai multe servicii proprii. Este vorba despre Google Search, Google Finance, aplicația Gemini și NotebookLM. Google vizează un scenariu în care utilizatorii pot delega căutarea și analiza informațiilor agenților AI.
Lansarea Gemini Deep Research a coincis cu prezentarea GPT-5.2 (cod „Garlic”) de către OpenAI, care afirmă că noul său model depășește rivalii în diverse benchmark-uri și teste interne. Momentul ales de Google a fost considerat strategic, consolidând competiția directă dintre cei doi giganți în domeniul agenților de cercetare și al modelelor AI avansate.
Un obiectiv primordial al noii versiuni este reducerea halucinațiilor AI, situații în care modelul generează informații incorecte sau inventate. Gemini 3 Pro, pe care se bazează noul agent, a fost antrenat special pentru a limita aceste erori în sarcini complexe. El reduce riscul ca o greșeală să compromită întregul proces decizional în contexte cu mai mulți pași.
Pentru a demonstra progresul tehnologic, Google a creat un nou benchmark, DeepSearchQA, destinat evaluării performanței agenților AI în sarcini complexe și multi-step. Agentul a fost testat și pe benchmark-uri independente precum Humanity’s Last Exam, recunoscut pentru dificultatea sa ridicată. De asemenea, a fost testat și pe BrowserComp, axat pe sarcini agentice desfășurate în browser.
Rezultatele au arătat că Gemini Deep Research a obținut scoruri excelente pe propriul benchmark și pe Humanity’s Last Exam. În schimb, ChatGPT 5 Pro de la OpenAI a înregistrat un scor ușor mai bun pe BrowserComp. Diferențele generale între cele două sisteme au fost, însă, relativ reduse.