Producătorul ChatGPT, OpenAI, l-a învins în finala unui turneu de șah dedicat AI-urilor pe Grok, inteligența artificială dezvoltată de Elon Musk.
Acest rezultat marchează un nou capitol în competiția dintre cele mai avansate sisteme de inteligență artificială, evidențiind supremația tehnologică a OpenAI în domeniul jocurilor strategice.
Foto: 42abudhabi.ae
De-a lungul timpului, șahul a fost folosit de companiile tech ca reper pentru a evalua progresul calculatoarelor, deoarece mașinile moderne de șah sunt practic invincibile împotriva celor mai buni jucători umani. Însă, această competiție nu a implicat computere concepute pentru șah, ci a avut loc între programe de inteligență artificială concepute pentru utilizare zilnică, după cum relatează BBC.
Modelul o3 al OpenAI a rămas neînvins pe parcursul întregului turneu și a câștigat finala în fața modelul Grok 4 al xAI, alimentând rivalitatea dintre cele două companii. Atât Elon Musk, cât și Sam Altman, cofondator al OpenAI, susțin că ultimele lor creații sunt cele mai inteligente AI-uri din lume. Locul al treilea a fost ocupat de modelul Gemini de la Google, care a reușit să învingă un alt model OpenAI.
Deși aceste AI-uri excelează în multe sarcini zilnice, încă mai au de îmbunătățit jocul de șah. Grok a făcut mai multe greșeli notabile în ultimele partide, inclusiv pierderea repetată a reginei.
„Până în semifinale, părea că nimic nu va opri Grok 4 să câștige competiția. În ciuda unor momente slabe, AI-ul xAI părea cel mai puternic jucător, dar în ultima zi iluzia s-a spulberat”, a declarat Pedro Pinhata, redactor la Chess.com.
Jocul „de nerecunoscut” și „greșit” al lui Grok a oferit modelului o3 ocazia unor victorii clare. Marele maestru Hikaru Nakamura a spus în timpul transmisiunii live că „Grok a făcut multe greșeli, pe când OpenAI a fost perfect”. Înainte de finală, Musk preciza într-o postare pe platforma X că succesul anterior al xAI în turneu a fost doar un „efect secundar” și că „nu a depus aproape niciun efort în șah”.
Turneul s-a desfășurat pe platforma Kaggle, deținută de Google, care permite cercetătorilor să își testeze sistemele prin intermediul competițiilor. Opt modele lingvistice mari, dezvoltate de Anthropic, Google, OpenAI, xAI și dezvoltatori chinezi precum DeepSeek și Moonshot AI, s-au întrecut timp de trei zile, informează publicația The Independent.
Dezvoltatorii de AI folosesc benchmark-uri pentru a testa abilități precum raționamentul sau programarea. Jocurile strategice complexe, bazate pe reguli, cum sunt șahul și Go, au fost adesea folosite pentru a evalua capacitatea modelelor de a învăța să atingă cele mai bune rezultate, în special să învingă adversarii.
Programul AlphaGo, dezvoltat de DeepMind pentru jocul chinezesc Go, a învins campioni umani la sfârșitul anilor 2010. Maestrul Lee Se-dol s-a retras în 2019 după mai multe înfrângeri în fața AlphaGo. Sir Demis Hassabis, cofondatorul DeepMind, a fost el însuși un copil-minune al șahului mondial. În anii ’90, campionii mondiali au fost provocați de computerele puternice. Victoria lui Deep Blue în fața marelui maestru Garry Kasparov a fost un moment istoric, demonstrând capacitatea calculatoarelor de a egala performanțele umane.
Două decenii mai târziu, Kasparov a comparat inteligența Deep Blue cu „cea a unui ceas cu alarmă”, dar a spus: „A pierde în fața unui ceas cu alarmă de 10 milioane de dolari nu m-a făcut să mă simt mai bine”.