IBM ha presentato oggi la nuova generazione della famiglia di modelli linguistici di grandi dimensioni (LLM) Granite, IBM Granite 3.2, in uno sforzo continuo per offrire un’intelligenza artificiale enterprise compatta, efficiente e pratica per un impatto reale.
Tutti i modelli Granite 3.2 – annuncia l’azienda – sono disponibili con licenza Apache 2.0 su Hugging Face. Alcuni modelli sono disponibili oggi su IBM watsonx.ai, Ollama, Replicate e LM Studio, e sono in arrivo a breve in RHEL AI 1.5, per offrire funzionalità avanzate alle aziende e alla comunità open-source.
Tra i punti salienti dei modelli Granite di nuova generazione IBM evidenzia i seguenti:
- Un nuovo vision language model (VLM) per compiti di comprensione dei documenti che ha dimostrato, afferma IBM, prestazioni pari o superiori a quelle di modelli significativamente più grandi – Llama 3.2 11B e Pixtral 12B – sui benchmark aziendali essenziali DocVQA, ChartQA, AI2D e OCRBench1. Oltre ai solidi dati di addestramento, IBM ha utilizzato il proprio toolkit open-source Docling per elaborare 85 milioni di PDF e generare 26 milioni di coppie sintetiche domanda-risposta per migliorare la capacità del VLM di gestire flussi di lavoro complessi e ricchi di documenti.
- Capacità Chain of thought per migliorare il ragionamento nei modelli 2 2B e 8B, con la possibilità di attivare o disattivare il ragionamento per ottimizzare l’efficienza. Grazie a questa capacità, il modello 8B ottiene miglioramenti a due cifre rispetto al suo predecessore in benchmark instruction-following come ArenaHard e Alpaca Eval senza degradare la sicurezza o le prestazioni altrove. Inoltre, grazie all’uso di nuovi metodi di scaling dell’inferenza, il modello Granite 3.2 8B secondo IBM può essere calibrato per rivaleggiare con le prestazioni di modelli molto più grandi come Claude 3.5 Sonnet o GPT-4o su benchmark di ragionamento matematico come AIME2024 e MATH5003.
- Opzioni di dimensioni ridotte per i modelli di sicurezza Granite Guardian che mantengono le prestazioni dei precedenti modelli Granite 3.1 Guardian con una riduzione del 30% delle dimensioni. I modelli 3.2 introducono anche una nuova funzione chiamata verbalized confidence, che offre una valutazione del rischio più sfumata che riconosce l’ambiguità nel monitoraggio della sicurezza.
La strategia di IBM di fornire modelli di intelligenza artificiale più piccoli e specializzati per le aziende continua a dimostrare la sua efficacia nei test, afferma l’azienda, con il modello Granite 3.1 8B che ha recentemente ottenuto punteggi elevati in termini di precisione nel Benchmark LLM di Salesforce per il CRM.
La famiglia di modelli Granite è supportata da un solido ecosistema di partner IBM, tra cui aziende software leader che incorporano gli LLM nelle loro tecnologie.
Granite 3.2 è un passo importante nell’evoluzione del portafoglio e della strategia di IBM per offrire un’intelligenza artificiale pratica e di piccole dimensioni alle imprese. Sebbene gli approcci di ragionamento a catena di pensiero siano potenti, richiedono una notevole potenza di calcolo che non è necessaria per tutte le attività, mette in evidenza il team. Per questo IBM ha introdotto la possibilità di attivare o disattivare la catena di pensiero in modo programmatico. Per i compiti più semplici, il modello può funzionare senza ragionamento per ridurre il sovraccarico di calcolo non necessario.
Inoltre, sottolinea IBM, altre tecniche di ragionamento come l’inference scaling hanno dimostrato che il modello Granite 3.2 8B può eguagliare o superare le prestazioni di modelli molto più grandi su benchmark standard di ragionamento matematico. L’evoluzione di metodi come l’inference scaling rimane un’area di interesse fondamentale per i team di ricerca IBM.
Oltre ai modelli Granite 3.2 instruct, vision e guardrail, IBM sta rilasciando la nuova generazione di modelli TinyTimeMixers (TTM), con meno di 10 milioni di parametri, con capacità di previsione a lungo termine fino a due anni nel futuro. Si tratta di strumenti potenti per l’analisi delle tendenze a lungo termine, tra cui quelle finanziarie ed economiche, la previsione della domanda della supply chain e la pianificazione stagionale delle scorte nel retail.
Per saperne di più su Granite 3.2, è possibile leggere l’articolo di approfondimento tecnico di IBM.






