GPT-5.4: cosa cambia per chi usa ChatGPT, API e Codex

gpt-5.4 chatgpt openai codex api

OpenAI ha annunciato GPT-5.4, un nuovo modello di frontiera progettato esplicitamente per il lavoro professionale. Il modello è disponibile in ChatGPT (come GPT-5.4 Thinking), nelle API e in Codex, mentre una versione GPT-5.4 Pro è destinata agli utenti che necessitano delle massime prestazioni su attività particolarmente complesse.
La nuova generazione integra in un unico sistema i progressi recenti dell’azienda in reasoning, coding e workflow agentici, con l’obiettivo di rendere l’AI più efficace nelle attività reali di lavoro: analisi di documenti, gestione di fogli di calcolo, creazione di presentazioni, sviluppo software e orchestrazione di strumenti digitali.

GPT-5.4 e il salto nel knowledge work

Uno degli obiettivi principali del nuovo modello è migliorare l’uso dell’AI nelle attività professionali quotidiane.
Nei test interni e nei benchmark di settore, GPT-5.4 mostra progressi significativi rispetto a GPT-5.2. Nel benchmark GDPval, che valuta la capacità di svolgere attività tipiche di 44 professioni in nove settori economici, il modello raggiunge l’83% di risultati pari o superiori a quelli di professionisti umani, contro il 70,9% del modello precedente.
Questo miglioramento si riflette anche nella qualità dei prodotti generati. Nei test sui fogli di calcolo, GPT-5.4 ottiene un punteggio medio dell’87,3%, mentre nella generazione di presentazioni gli utenti umani hanno preferito i risultati del nuovo modello nel 68% dei casi, citando una migliore qualità visiva e una maggiore varietà grafica.
Parallelamente, OpenAI dichiara di aver ridotto gli errori fattuali: le singole affermazioni prodotte dal modello risultano 33% meno probabilmente false rispetto a GPT-5.2.

Agentic AI e computer use nativo

Uno degli elementi più rilevanti della nuova versione è l’introduzione di capacità native di utilizzo del computer.
GPT-5.4 è in grado di operare direttamente su ambienti software, siti web e applicazioni attraverso comandi di mouse e tastiera o tramite librerie di automazione come Playwright. In questo modo un agente può, ad esempio, leggere email, estrarre allegati, compilare un foglio di calcolo o interagire con interfacce web.
Nei benchmark dedicati all’automazione dei sistemi informatici, il modello registra progressi significativi. Nel test OSWorld-Verified, che misura la capacità di navigare un desktop attraverso screenshot e azioni coordinate, GPT-5.4 raggiunge il 75% di successo, superando sia GPT-5.2 (47,3%) sia il livello medio umano (72,4%).

Coding e sviluppo software

Il nuovo modello integra anche le capacità di programmazione sviluppate con GPT-5.3-Codex, mantenendo o superando le prestazioni di quel sistema nel benchmark SWE-Bench Pro.
OpenAI sottolinea che GPT-5.4 è particolarmente efficace nei progetti software complessi e nelle attività iterative di sviluppo, dove il modello può utilizzare strumenti, eseguire codice e verificare autonomamente i risultati.
In Codex è inoltre disponibile una modalità /fast, che aumenta la velocità di generazione fino a 1,5 volte, permettendo agli sviluppatori di iterare più rapidamente durante il debugging o la scrittura di codice.

Screenshot

Migliore integrazione con strumenti e API

Un’altra novità importante riguarda l’uso degli strumenti esterni.
Con tool search, il modello non riceve più tutte le definizioni degli strumenti all’interno del prompt iniziale. Invece ottiene un elenco leggero e può recuperare dinamicamente la definizione dello strumento quando necessario. Questo approccio riduce i token utilizzati e rende più efficiente l’interazione con ecosistemi software complessi.
Nei test su sistemi con numerosi strumenti, questo metodo ha ridotto il consumo di token del 47% mantenendo lo stesso livello di accuratezza.

Web search più persistente

GPT-5.4 migliora anche le capacità di ricerca web agentica, ovvero la possibilità di navigare autonomamente tra diverse fonti per trovare informazioni difficili da individuare.
Nel benchmark BrowseComp, il modello ottiene 82,7%, un miglioramento di oltre 17 punti percentuali rispetto a GPT-5.2.
Questo significa che il sistema è più efficace nel raccogliere dati da più fonti, verificare le informazioni e sintetizzare risposte strutturate per domande complesse.

Context window fino a 1 milione di token

Per applicazioni avanzate, GPT-5.4 supporta una context window fino a 1 milione di token in Codex e nelle API.
Questo consente di lavorare su progetti molto lunghi, come grandi repository di codice, contratti complessi o dataset estesi, mantenendo coerenza nel ragionamento lungo tutta la sessione.

Disponibilità e prezzi

GPT-5.4 viene distribuito gradualmente all’interno di ChatGPT, nelle API e in Codex.
In ChatGPT, GPT-5.4 Thinking sostituisce GPT-5.2 Thinking per gli utenti Plus, Team e Pro, mentre GPT-5.2 resterà disponibile come modello legacy fino al 5 giugno 2026.
Sul fronte API, il prezzo aumenta rispetto alla generazione precedente:

2,50$ per milione di token in input

15$ per milione di token in output
Nonostante il costo più elevato per token, OpenAI sostiene che la maggiore efficienza del modello riduce il numero complessivo di token necessari per completare molte attività.

Un modello pensato per il lavoro reale

Con GPT-5.4 OpenAI cerca di consolidare un’evoluzione precisa della piattaforma: passare da modelli conversazionali generici a sistemi progettati per workflow professionali completi.
L’integrazione di reasoning avanzato, capacità di coding, uso diretto del computer e integrazione con strumenti software punta a rendere l’AI non solo uno strumento di assistenza, ma un componente operativo nei processi di lavoro digitali.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome