o3, l’ennesimo passo in avanti di OpenAI verso l’AGI
L'annuncio è arrivato nelle scorse ore. Il nuovo modello ha ottenuto risultati tre volte superiori rispetto a quello presentato nel mese di settembre
24/12/2024 di Redazione Giornalettismo
Nel mese di settembre, l’azienda di San Francisco aveva annunciato il primo mattoncino per la costruzione dell’Intelligenza Artificiale Generale (AGI). Si chiamava o1 e, nel giro di pochissimi mesi, si è già arrivati a un’ulteriore evoluzione. Nelle scorse ore, infatti, OpenAI ha annunciato l’arrivo del modello o3, l’evoluzione del precedente e che ha mostrato enormi passi in avanti per quel che riguarda il calcolo e la risoluzione di problemi matematici. Si tratta di due metriche fondamentali per comprendere quanto un LLM sia in grado di avvicinarsi al ragionamento di un essere umano.
LEGGI ANCHE > Alla fine, OpenAI è stata multata dal Garante Privacy italiano
Manca qualcosa nel mezzo? Piccolo “fuori tema”: OpenAI è passata dal modello o1 a quello o3, saltando o2. Il motivo è piuttosto semplice: il nome “o2” è di proprietà di una compagnia telefonica attiva nel Regno Unito, in Spagna e altri Paesi europei (e fu anche sponsor della squadra di calcio dell’Arsenal). Dunque, non c’è stato un salto in avanti, ma una scelta logica per evitare di incappare in problemi legati alla registrazione del marchio.
OpenAI o3, un passo in avanti verso l’AGI?
Ma come funziona il modello OpenAI o3 (e o3-mini)? Nella presentazione di questa evoluzione “artificiale”, i ricercato dell’azienda di Sam Altman hanno spiegato quali sono stati i principali progressi registrati nel corso degli ultimi mesi.
Come accadeva già con il modello o1, anche la sua evoluzione si basa sul cosiddetto “apprendimento per rinforzo” (che abbiamo spiegato in questo approfondimento), elemento fondamentale nella lunga strada – che ora si sta accorciando sempre più – verso un’intelligenza artificiale generale in grado di ragionare come un essere umano. A differenza del suo predecessore, il modello o3 è in grado di modificare la durata del ragionamento (che può essere indicata in basso, medio o alto) con un effetto conseguente sulla potenza di elaborazione delle risposte.
Questi tre elementi combinati portano a un aumento nella latenza delle risposte rispetto ai prompt (comandi), ma – allo stesso tempo – riescono a rispondere in modo più corretto e coerente. Soprattutto per quel che riguarda le questioni legate al mondo della matematica applicata. Infatti, i risultati in base al test ARC-AGI (Abstract and Reasoning Corpus for Artificial General Intelligence) – fondamentale per analizzare le capacità di apprendimento e ragionamento di una macchina AI rispetto a un essere umano – il punteggio finale ha portato a un risultato di circa tre volte superiore rispetto al modello o1.
Un dato molto importante ma che sembra essere ancora molto distante dal raggiungimento di un’intelligenza artificiale generale. Infatti, questi risultati dovranno essere applicati anche al benchmark ARC-AGI-2 che ha dei vincoli molto più selettivi e stringenti rispetto a quello attualmente utilizzato.