Modelul Gemini 2.5 de la Google DeepMind a rezolvat o problemă reală care i-a blocat pe programatorii umani. Acest moment a fost considerat „istoric” în evoluția inteligenței artificiale.
Versiunea Gemini 2.5 a rezolvat, în mai puțin de o jumătate de oră, o problemă complexă de optimizare. Aceasta a încurcat echipele umane la Concursul Internațional de Programare desfășurat în Azerbaidjan.
Sarcina presupunea găsirea unei metode eficiente de a trimite lichid printr-o rețea infinită de conducte și rezervoare interconectate. Scopul era distribuirea rapidă și echilibrată a lichidului. Acest test cerea abstractizare, creativitate și capacitatea de a analiza un număr infinit de posibilități.
Niciuna dintre echipele de elită, provenite din universități de prestigiu din Rusia, China și Japonia, nu a reușit să ofere soluția corectă. Gemini 2.5 a obținut medalia de aur și s-a clasat pe locul doi dintr-un total de 139 de echipe internaționale. Aceasta a reușit să treacă 10 din cele 12 provocări impuse, notează The Guardian.
Vicepreședintele Google DeepMind, Quoc Le, a numit momentul echivalent cu marile borne istorice. Acestea includ Deep Blue, care l-a învins pe Kasparov la șah în 1997, și AlphaGo, care a depășit un campion mondial de Go în 2016. Diferența este că acum vorbim despre o problemă inspirată din lumea reală, nu doar un joc cu reguli fixe.
„Este un pas uriaș spre inteligența artificială generală. Vorbim despre raționament aplicat în domenii practice, ceea ce poate transforma știința și ingineria”, a declarat Quoc Le.
Exemplele de aplicare includ dezvoltarea de medicamente și designul de microcipuri, domenii unde creativitatea și eficiența contează enorm.
Modelul Gemini 2.5 a fost antrenat special pentru sarcini dificile de codare, matematică și raționament. Conform Google, performanța sa este comparabilă cu cea a unui programator din top 20 mondial.
Deși Google a prezentat succesul drept un „moment istoric”, unii experți îndeamnă la prudență. Stuart Russell, profesor de informatică la Universitatea Berkeley, a atras atenția că declarațiile despre „semnificație epocală” sunt exagerate.
El a explicat că sistemele AI au progresat constant în programare. Precedentul moment Deep Blue a avut un impact limitat în lumea reală. Totuși, Russell a admis că rezolvarea corectă a unei probleme de concurs ICPC reprezintă un pas înainte. Aceasta contribuie spre generarea de cod fiabil și de calitate.
Michael Wooldridge, profesor la Universitatea Oxford, a apreciat performanța. Totuși, a ridicat semne de întrebare privind resursele de calcul folosite. Google nu a oferit detalii precise. Ei au confirmat doar că au depășit capacitățile accesibile abonaților obișnuiți ai serviciului Google AI Ultra, care costă 250 de dolari pe lună.
ICPC, competiția unde Gemini 2.5 a făcut istorie, reunește anual cei mai buni programatori de nivel universitar din lume. Dr. Bill Poucher, directorul executiv al competiției, a subliniat importanța momentului: „Obținerea unor rezultate de nivel aur de către un AI marchează o etapă crucială pentru definirea standardelor viitoare”.
Provocările acestui tip de concurs solicită nu doar calcule brute, ci și ingeniozitate, abstractizare și creativitate, calități considerate până acum exclusiv umane. Participarea unui AI la același nivel cu programatori de top arată cum competițiile academice devin laboratoare de testare pentru noile generații de algoritmi.