O echipă de cercetători de la Massachusetts Institute of Technology (MIT) a dezvoltat un concept revoluționar: un „tabel periodic” al algoritmilor inteligenței artificiale, care organizează și clasifică modelele într-o structură vizuală inspirată de celebrul tabel periodic al elementelor chimice creat de Dmitri Mendeleev.
Cercetătorii au creat un cadru unificator în dorința de a ajuta oamenii de știință să combine ideile existente pentru a îmbunătăți modelele de inteligență artificială sau pentru a crea altele noi.
Tabelul periodic pornește de la o idee cheie: toți acești algoritmi învață un anumit tip de relație între punctele de date. Deși fiecare algoritm poate realiza acest lucru într-un mod ușor diferit, matematica de bază din spatele fiecărei abordări este aceeași.
Bazându-se pe aceste descoperiri, cercetătorii au identificat o ecuație unificatoare care stă la baza multor algoritmi clasici de inteligență artificială și au folosit acea ecuație pentru a reformula metodele populare și a le aranja într-un tabel, clasificându-le pe fiecare în funcție de relațiile aproximative pe care le învață.
La fel ca clasicul tabel periodic al elementelor chimice al lui Mendeleev, care inițial conținea pătrate goale care au fost ulterior completate de oamenii de știință, tabelul periodic al învățării automate are și el spații goale. Aceste spații prezic unde ar trebui să existe algoritmi, dar care nu au fost încă descoperiți.
Tabelul oferă cercetătorilor un set de instrumente pentru a proiecta noi algoritmi fără a fi nevoie să redescopere idei din abordări anterioare, spune Shaden Alshammari, student absolvent la MIT și autor principal al unei lucrări despre acest nou cadru.
„Nu este doar o metaforă. Începem să vedem învățarea automată ca un sistem cu o structură care este un spațiu pe care îl putem explora, mai degrabă decât să ghicim drumul prin el”, a spus cercetătoarea pentru MIT News.
După ce s-a alăturat Laboratorului Freeman, Alshammari a început să studieze clusteringul, o tehnică de învățare automată care clasifică imaginile prin învățarea organizării imaginilor similare în clustere apropiate.
Ea și-a dat seama că algoritmul de clustering pe care îl studia era similar cu un alt algoritm clasic de învățare automată, numit învățare contrastivă, și a început să aprofundeze matematica. Alshammari a descoperit că acești doi algoritmi disparați puteau fi reformulați folosind aceeași ecuație de bază.
Cadrul pe care l-au creat, învățarea contrastivă a informațiilor (I-Con), arată cum o varietate de algoritmi pot fi priviți prin prisma acestei ecuații unificatoare. Acesta include totul, de la algoritmi de clasificare care pot detecta spamul până la algoritmii de învățare profundă care alimentează LLM-urile.
Ecuația descrie modul în care astfel de algoritmi găsesc conexiuni între puncte de date reale și apoi aproximează aceste conexiuni intern.
Fiecare algoritm își propune să minimizeze abaterea dintre conexiunile pe care învață să le aproximeze și conexiunile reale din datele sale de antrenament.
Prin urmare, echipa de cercetători a decis să organizeze I-Con într-un tabel periodic pentru a clasifica algoritmii pe baza modului în care punctele sunt conectate în seturi de date reale și a principalelor modalități prin care algoritmii pot aproxima aceste conexiuni. Pe măsură ce aranjau tabelul, cercetătorii au început să vadă lacune acolo unde puteau exista algoritmi, dar care nu fuseseră încă inventați.
Cercetătorii au umplut o lacună împrumutând idei dintr-o tehnică de învățare automată numită învățare contrastivă și aplicându-le la gruparea imaginilor. Acest lucru a dus la un nou algoritm care putea clasifica imaginile neetichetate cu 8% mai bine decât o altă abordare de ultimă generație.
Utilizarea I-Con ca ghid ar putea ajuta oamenii de știință din domeniul învățării automate să gândească în afara tiparelor, încurajându-i să combine idei în moduri la care altfel nu s-ar fi gândit neapărat.
Cercetarea a fost finanțată, parțial, de Air Force Artificial Intelligence Accelerator, National Science Foundation AI Institute for Artificial Intelligence and Fundamental Interactions și Quanta Computer.