OpenAI ha annunciato il lancio nella sua API di una nuova serie composta da tre nuovi modelli: GPT-4.1, GPT-4.1 mini e GPT-4.1 nano.
Questi modelli – afferma OpenAI – superano le prestazioni di GPT-4o e GPT-4o mini su tutta la linea, con notevoli miglioramenti nel coding e nell’instruction following.
Inoltre, i nuovi modelli dispongono di finestre di contesto più ampie, in grado di supportare fino a 1 milione di token di contesto, e sono in grado di utilizzare meglio tale contesto, migliorando la comprensione del contesto lungo. Hanno un cutoff di conoscenze aggiornato a giugno 2024.
GPT-4.1 eccelle nei benchmark standard del settore ma, sottolinea OpenAI, sebbene i benchmark forniscano indicazioni preziose, il team ha addestrato questi modelli concentrandosi sull’utilità del mondo reale. La stretta collaborazione e la partnership con la community degli sviluppatori ha permesso di ottimizzare questi modelli per le attività più importanti per le loro applicazioni.
A tal fine, OpenAI mette in evidenza che la famiglia di modelli GPT-4.1 offre prestazioni eccellenti a un costo inferiore, e spingono le prestazioni in avanti in ogni punto della curva di latenza.
GPT-4.1 mini rappresenta un salto significativo nelle prestazioni dei modelli di piccole dimensioni, battendo persino GPT-4o in molti benchmark, afferma il team. Eguaglia o supera GPT-4o nelle valutazioni di intelligenza, riducendo al contempo la latenza di quasi la metà e il costo dell’83%.
Per le attività che richiedono una bassa latenza, GPT-4.1 nano è il modello più veloce ed economico. Offre prestazioni elevate con dimensioni ridotte con la sua finestra di contesto da 1 milione di token e ottiene un punteggio dell’80,1% su MMLU, del 50,3% su GPQA e del 9,8% su Aider polyglot coding, addirittura superiore a GPT-4o mini. È ideale per compiti come la classificazione o il completamento automatico.
Questi miglioramenti nell’affidabilità di seguire le istruzioni e nella comprensione di contesti lunghi rendono i modelli GPT-4.1 molto più efficaci nell’alimentare gli agenti, ovvero i sistemi in grado di svolgere autonomamente compiti per conto degli utenti. Se combinati con primitive come la Responses API, gli sviluppatori possono ora creare agenti più utili e affidabili per l’ingegneria del software nel mondo reale, l’estrazione di informazioni da documenti di grandi dimensioni, la risoluzione delle richieste dei clienti con un minimo di assistenza e altri compiti complessi.
GPT-4.1 sarà disponibile solo tramite API. In ChatGPT, molti dei miglioramenti apportati a livello di istruzioni, codifica e intelligenza sono stati gradualmente incorporati nell’ultima versione di GPT-4o, sottolinea OpenAI, che aggiunge che il team continuerà a incorporarne altri nelle versioni future.
Maggiori informazioni e benchmark sono disponibili sul sito di OpenAI.









