OpenAI, compania care a revoluționat inteligența artificială cu ChatGPT, lansează două modele lingvistice deschise pentru dezvoltatori și pasionați de AI. Mișcarea vine după mai bine de cinci ani în care gigantul tech a oferit exclusiv modele închise, dar entuziasmul comunității este temperat de limitările și problemele de acuratețe ale noilor soluții.
OpenAI a anunțat lansarea a două modele lingvistice cu acces deschis, numite gpt-oss-120b și gpt-oss-20b. Este prima inițiativă de acest tip după o perioadă de peste cinci ani în care compania s-a concentrat exclusiv pe dezvoltarea de modele închise, oferite prin API-uri sau platforme proprii, cum este ChatGPT.
Această lansare marchează o schimbare semnificativă de strategie pentru OpenAI, care fusese anterior criticată pentru lipsa de transparență și refuzul de a împărtăși cod sursă sau seturi de date. Modelele deschise sunt acum disponibile pentru descărcare pe platforma Hugging Face, una dintre cele mai populare comunități AI open-source.
Cele două modele lansate diferă semnificativ în ceea ce privește puterea de procesare și resursele necesare:
gpt-oss-120b – Este cel mai performant dintre cele două și poate fi rulat pe un sistem cu o singură placă video Nvidia. Acesta se adresează în special dezvoltatorilor și laboratoarelor de cercetare care dispun de hardware mai puternic, dar nu necesită infrastructura complexă a modelelor de ultimă generație OpenAI
gpt-oss-20b – Este mai accesibil și poate rula pe un laptop obișnuit cu 16 GB RAM, făcând posibilă testarea și utilizarea sa inclusiv de către pasionații individuali sau startup-urile cu resurse limitate
Potrivit testelor prezentate de OpenAI, performanța ambelor modele este inferioară versiunilor comerciale de top precum GPT-4, dar depășește alte soluții open-source existente pe piață.
Deși sunt prezentate ca „open-source”, aceste modele nu pot executa toate sarcinile pe care le îndeplinesc modelele comerciale ale OpenAI. Atunci când întâlnesc cerințe prea complexe, modelele deschise se pot conecta automat prin cloud la versiunile mai avansate, oferind utilizatorilor răspunsurile de care au nevoie, dar păstrând totuși dependența de infrastructura OpenAI.
Un aspect criticat este lipsa informațiilor despre sursele de date utilizate pentru antrenarea celor două modele. În mod obișnuit, modelele cu adevărat open-source oferă detalii complete despre datele de instruire, pentru a permite auditul și verificarea eticii utilizării acestora. OpenAI a ales să nu dezvăluie aceste informații, menținând un grad de opacitate.
În plus, testele interne indică o rată ridicată a halucinațiilor, adică a răspunsurilor complet eronate sau fabricate:
gpt-oss-120b – halucinează în aproximativ 49% din cazuri
gpt-oss-20b – rata crește la 53%, ceea ce înseamnă că mai mult de jumătate din răspunsuri nu pot fi considerate de încredere