OpenAI ha presentato i suoi nuovi modelli di intelligenza artificiale, o3 e o4-mini. Una delle innovazioni più rilevanti è la capacità di queste AI di compiere ragionamenti articolati a partire da immagini caricate. “Per la prima volta, i nostri modelli possono pensare con le immagini nella loro catena di pensiero, non solo vederle”, si legge in un post pubblicato sul blog ufficiale di OpenAI. L’obiettivo è quello di fondere le informazioni visive contenute nelle immagini nel processo stesso di elaborazione delle risposte.
Questo consente agli utenti di inviare file come disegni, schemi o diagrammi — anche se sfocati o non perfettamente nitidi — che ChatGpt sarà in grado di comprendere e manipolare in tempo reale. Ad esempio, potrà ruotare o ingrandire sezioni specifiche, come parte della sua analisi. Questa funzione risulta particolarmente utile in mobilità: quando si utilizza il chatbot da smartphone, non sarà necessario preoccuparsi della qualità dell’immagine o dell’inquadratura esatta, perché ChatGpt saprà comunque interpretare e utilizzare correttamente i contenuti.
Come per i modelli precedenti, anche o3 e o4-mini sono pensati per offrire capacità di riflessione più approfondite. Una caratteristica che, secondo OpenAI, li rende “i modelli più intelligenti che abbiamo rilasciato finora”, aggiungendo che “rappresentano un cambiamento radicale nelle capacità di ChatGpt”.
Entrando nei dettagli, o3 è stato sviluppato per affrontare domande complesse, che richiedono giudizi articolati e prospettive multiple, specialmente in situazioni dove non esiste una singola risposta corretta. Al contrario, o4-mini è invece una versione più compatta e ottimizzata per compiti di ragionamento rapidi e a basso costo.
Nonostante la sua struttura più leggera, OpenAI sottolinea che il modello ha stabilito nuovi standard di accuratezza, soprattutto in contesti come le materie tecnico-scientifiche, Stem. o3 e o4-mini sono già accessibili per gli utenti con un piano a pagamento ChatGpt Plus, Pro e Team, mentre arriveranno a breve per ChatGpt Enterprise ed Edu. Gli utenti free possono testare o4-mini selezionando “Think” nella schermata di composizione del prompt.