Prima pagină » Un chatbot AI i-a depășit pe cei mai buni 30 de matematicieni ai lumii, demonstrând o capacitate de raționament fără precedent

Un chatbot AI i-a depășit pe cei mai buni 30 de matematicieni ai lumii, demonstrând o capacitate de raționament fără precedent

Un chatbot AI i-a depășit pe cei mai buni 30 de matematicieni ai lumii, demonstrând o capacitate de raționament fără precedent
Puterea persuasivă a AI: Cum pot chatboții să schimbe opiniile oamenilor

În mijlocul lunii mai, treizeci dintre cei mai renumiți matematicieni ai lumii au participat la o întâlnire secretă cu un scop neobișnuit: să testeze limitele unui chatbot capabil să rezolve probleme matematice complexe. Acești experți au pus la încercare un model de inteligență artificială, numit o4-mini, cu întrebări la nivel de profesor universitar, iar rezultatele i-au lăsat fără cuvinte.

„Am colegi care au spus literalmente că aceste modele se apropie de geniul matematic”, a declarat Ken Ono, matematician la Universitatea din Virginia și unul dintre liderii și judecătorii întâlnirii.

Ce este o4-mini și cum funcționează?

Chatbotul o4-mini este un model de limbaj mare (LLM) specializat în raționamente complexe, antrenat de OpenAI pentru a face deducții matematice sofisticate. Similar cu Gemini 2.5 Flash, echivalentul dezvoltat de Google, aceste modele sunt mai ușoare și mai agile decât versiunile anterioare, fiind instruite pe seturi de date specializate și beneficiind de o consolidare mai puternică din partea oamenilor. Spre deosebire de modelele tradiționale, o4-mini poate aborda probleme matematice mult mai profunde și complexe, scrie Live Science.

Testarea capacităților AI: proiectul FrontierMath

Pentru a evalua progresul lui o4-mini, OpenAI a colaborat cu Epoch AI, o organizație nonprofit care testează performanța LLM-urilor, pentru a crea un set de 300 de întrebări matematice ale căror soluții nu fuseseră încă publicate. În septembrie 2024, Elliot Glazer, proaspăt doctor în matematică, s-a alăturat proiectului FrontierMath, care a colectat întrebări de dificultăți diferite, de la nivel universitar până la provocări de cercetare. Până în aprilie 2025, o4-mini rezolvase aproximativ 20% din aceste întrebări. Apoi, Glazer a introdus un al patrulea nivel, cu întrebări dificile chiar și pentru matematicieni de top.

Întâlnirea secretă și provocarea botului

Matematicienii implicați au semnat acorduri de confidențialitate și au comunicat exclusiv prin aplicația Signal pentru a evita contaminarea datelor. Fiecare problemă nerezolvată de o4-mini aducea creatorului său o recompensă de 7.500 de dolari. Pentru a accelera procesul, Epoch AI a organizat o întâlnire fizică în weekendul 17-18 mai 2025, unde cei 30 de participanți, împărțiți în grupuri de câte șase, au lucrat intens pentru a crea întrebări care să pună la încercare AI-ul.

O soluție neașteptată și o reacție surprinsă

Sâmbătă seara, Ken Ono a fost surprins de performanța botului. El a propus o problemă deschisă în teoria numerelor, la nivel de doctorat, iar o4-mini a început să rezolve problema în timp real, explicându-și raționamentul. După ce a analizat literatura de specialitate, botul a decis să rezolve mai întâi o versiune simplificată a problemei, pentru a învăța, apoi a revenit la problema principală, oferind o soluție corectă și chiar cu o notă de umor:

„Nu este nevoie de citare, pentru că numărul misterios a fost calculat de mine!”

Ono a recunoscut că nu era pregătit să concureze cu un model atât de avansat și a alertat restul participanților.

Provocări și perspective asupra viitorului matematicii

Deși AI-ul a fost învins în zece cazuri, progresul său în doar un an a fost uimitor. Ono a comparat colaborarea cu o4-mini cu cea a unui coleg puternic, iar Yang Hui He, matematician la London Institute for Mathematical Sciences, a remarcat că performanța botului depășea chiar și a unui student foarte bun de doctorat. Botul rezolva probleme în câteva minute, ceea ce unui expert i-ar lua săptămâni sau luni.

Cu toate acestea, Ono și He au exprimat îngrijorări privind încrederea excesivă în rezultatele AI-ului.

„Există demonstrația prin inducție, demonstrația prin contradicție și apoi demonstrația prin intimidare”, spune He. „Dacă spui ceva cu suficientă autoritate, oamenii se sperie. Cred că o4-mini a stăpânit demonstrația prin intimidare; spune totul cu atâta încredere.”

Matematicienii și AI-ul: o nouă eră

Discuțiile s-au îndreptat spre „nivelul cinci” – întrebări pe care nici cei mai buni matematicieni nu le pot rezolva. Dacă AI-ul va ajunge la acest nivel, rolul matematicienilor se va schimba radical, trecând de la rezolvarea problemelor la formularea lor și colaborarea cu roboții pentru descoperirea de noi adevăruri matematice, asemănător modului în care profesorii lucrează cu studenții.

„Le spun colegilor mei că este o greșeală gravă să spui că inteligența artificială generalizată nu va veni niciodată, că e doar un calculator”, afirmă Ono. „Nu vreau să amplific isteria, dar în anumite privințe aceste modele mari de limbaj deja depășesc majoritatea celor mai buni doctoranzi din lume.”

Alte articole importante
Statul își rezervă dreptul să intervină rapid pentru salvarea fabricilor strategice din industria de apărare
Statul își rezervă dreptul să intervină rapid pentru salvarea fabricilor strategice din industria de apărare
Guvernul a modificat cadrul legislativ astfel încât statul român să poată interveni mai rapid și mai eficient pentru a proteja capacitățile strategice din industria de apărare, atunci când acestea riscă să fie închise, fragmentate sau vândute. Anunțul a fost făcut de ministrul interimar al Economiei, Irineu Darău, care susține că noile reguli oferă României instrumentele […]
ANALIZĂ
Atenție la Bitcoin! 245.000 de portofele au dispărut din rețea în doar cinci zile. E cel mai masiv exod al investitorilor din ultimii 2 ani
Atenție la Bitcoin! 245.000 de portofele au dispărut din rețea în doar cinci zile. E cel mai masiv exod al investitorilor din ultimii 2 ani
Bitcoin a pierdut aproximativ 245.000 de deținători de portofele în doar cinci zile, cel mai rapid ritm de ieșire al investitorilor din aproape ultimii doi ani, potrivit firmei de analiză on-chain Santiment. Ultima dată când s-a întâmplat ceva similar, în vara anului 2024, fenomenul a precedat unul dintre cele mai importante raliuri „bull” din ultimii […]
Precedentul Nike. Gigantul american, acuzat în instanță de consumatori că nu returnează taxele vamale 
Precedentul Nike. Gigantul american, acuzat în instanță de consumatori că nu returnează taxele vamale 
Nike a fost dată în judecată în Statele Unite într-un proces colectiv care ar putea deschide un nou front juridic pentru marile companii afectate de războiul comercial lansat de administrația Donald Trump. Consumatorii acuză gigantul american că a transferat costurile tarifelor vamale către clienți prin majorări de prețuri, scrie Reuters. Acum ar putea încasa și […]
Commerzbank taie 3.000 de locuri de muncă și își ridică țintele financiare în războiul cu UniCredit
Commerzbank taie 3.000 de locuri de muncă și își ridică țintele financiare în războiul cu UniCredit
Gigantul german Commerzbank anunță eliminarea a aproximativ 3.000 de locuri de muncă și o nouă strategie financiară mai agresivă pentru a demonstra investitorilor că poate rămâne independentă în fața tentativei de preluare lansate de grupul italian UniCredit, relatează Reuters. Conflictul dintre cele două bănci durează de luni de zile şi îl opune pe CEO-ul UniCredit, […]
ANALIZĂ
China intră în noul superciclu AI. Creșterea accelerată a exporturilor și a excedentului cu SUA dictează agenda summitului Trump – Xi
China intră în noul superciclu AI. Creșterea accelerată a exporturilor și a excedentului cu SUA dictează agenda summitului Trump – Xi
Exporturile Chinei au crescut cu 14,1% în aprilie faţă de anul precedent, a anunţat sâmbătă  Beijingul, inelastic la războiul din Iran şi la tarifele americane. Datele au fost publicate cu doar câteva zile înainte de întâlnirea de săptămâna viitoare între preşedintele american Donald Trump şi liderul chinez Xi Jinping. Această creștere a exporturilor a dus […]
ANALIZĂ
De ce riscă SUA să piardă statutul de „mare putere” după ce datoria publică a trecut pragul 100% din PIB. Atlantic Council: Din 2024 dobânzile nete au depășit cheltuielile pentru apărare
De ce riscă SUA să piardă statutul de „mare putere” după ce datoria publică a trecut pragul 100% din PIB. Atlantic Council: Din 2024 dobânzile nete au depășit cheltuielile pentru apărare
Statele Unite au depășit un prag economic și simbolic rar întâlnit în istoria modernă: datoria publică americană a trecut oficial de 100% din PIB, ajungând la peste 31.265 trilioane de dolari. Ultima dată când SUA s-au aflat într-o situație similară era 1946, imediat după Al Doilea Război Mondial. De această dată însă, contextul este complet […]