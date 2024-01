In occasione del CES 2024 di Las Vegas, NVIDIA ha annunciato le GPU desktop GeForce RTX SUPER, progettate per fornire prestazioni di AI generativa potenziate, ha presentato nuovi laptop AI di tutti i principali produttori e lanciato nuovi software e strumenti AI accelerati da NVIDIA RTX per sviluppatori e utenti.

Basandosi su decenni di esperienza nel settore dei PC, con oltre 100 milioni di GPU RTX che hanno dato il via all’era dell’AI PC, NVIDIA intende offrire ora questi strumenti per migliorare le esperienze su PC con l’AI generativa: l’accelerazione di NVIDIA TensorRT del noto modello Stable Diffusion XL per i workflow text-to-image, NVIDIA RTX Remix con strumenti di texture basati su AI generativa, e i microservizi NVIDIA ACE.

Inoltre, NVIDIA TensorRT-LLM (TRT-LLM), una libreria open source che accelera e ottimizza le prestazioni di inferenza dei più recenti modelli linguistici di grandi dimensioni (LLM), ora supporta più modelli pre-ottimizzati per i pc. Accelerata da TRT-LLM, Chat with RTX, una tech demo di NVIDIA in uscita questo mese, permette agli appassionati di AI di interagire con i propri appunti, documenti e altri contenuti.

“L’AI generativa è la transizione di piattaforma più significativa nella storia del computing e trasformerà ogni settore, compreso quello del gaming“, ha dichiarato Jensen Huang, fondatore e CEO di NVIDIA. “Con oltre 100 milioni di PC e workstation RTX AI, NVIDIA rappresenta una base di installazione enorme per gli sviluppatori e i gamer, che potranno godere della magia dell’AI generativa“.

L’esecuzione dell’AI generativa in locale su un PC – sottolinea l’azienda – è fondamentale per le applicazioni sensibili a privacy, latenza e costi. Richiede un’ampia base installata di sistemi pronti per l’AI, nonché gli strumenti giusti per gli sviluppatori per fare il tuning e ottimizzare i modelli di AI per la piattaforma PC.

Per rispondere a queste esigenze, NVIDIA sta offrendo innovazioni in tutto il suo stack tecnologico, promuovendo nuove esperienze e basandosi sulle oltre 500 applicazioni e giochi per PC abilitati all’intelligenza artificiale già accelerati dalla tecnologia NVIDIA RTX.

Le GPU NVIDIA RTX – in grado di eseguire una vasta gamma di applicazioni alle massime prestazioni – possono sbloccare il pieno potenziale dell’AI generativa sui PC. I Tensor Core di queste GPU accelerano in modo sorprendente le prestazioni dell’intelligenza artificiale nelle applicazioni più impegnative per il lavoro e il tempo libero.

Le nuove schede grafiche GeForce RTX 40 SUPER Series, anch’esse annunciate al CES, includono GeForce RTX 4080 SUPER, 4070 Ti SUPER e 4070 SUPER per prestazioni AI allo stato dell’arte. La GeForce RTX 4080 SUPER genera video AI 1,5 volte più velocemente, e immagini 1,7 volte più velocemente, rispetto alla GPU GeForce RTX 3080 Ti. I Tensor Core delle GPU SUPER offrono fino a 836 trilioni di operazioni al secondo, fornendo capacità di AI trasformative alla creazione di contenuti e alla produttività quotidiana.

I principali produttori, tra cui Acer, ASUS, Dell, HP, Lenovo, MSI, Razer e Samsung, stanno rilasciando una nuova ondata di computer portatili RTX AI, che offrono agli utenti una serie completa di funzionalità di AI generativa agli utenti fin dal primo momento. I nuovi sistemi, che offrono un aumento delle prestazioni da 20x a 60x rispetto all’utilizzo di unità di neural processing unit, saranno disponibili a partire da questo mese.

Le workstation mobili con GPU RTX possono eseguire il software NVIDIA AI Enterprise, fra cui TensorRT e NVIDIA RAPIDS, per uno sviluppo di AI generativa e data science semplificato e sicuro. Una licenza triennale per NVIDIA AI Enterprise è inclusa in ogni GPU NVIDIA A800 40GB Active e offre una piattaforma di sviluppo workstation ideale per l’AI e la scienza dei dati.

Nuovi strumenti NVIDIA per sviluppatori, per la costruzione di modelli di intelligenza artificiale

Per aiutare gli sviluppatori a creare, testare e personalizzare rapidamente modelli generativi di intelligenza artificiale e LLM preaddestrati, utilizzando prestazioni e ingombro di memoria di livello PC, NVIDIA ha recentemente annunciato NVIDIA AI Workbench, un toolkit unificato e di facile utilizzo.

AI Workbench, che sarà rilasciato in versione beta alla fine del mese, offre un accesso semplificato ai repository più diffusi come Hugging Face, GitHub e NVIDIA NGC, oltre a un’interfaccia utente semplificata che consente agli sviluppatori di riprodurre, collaborare e migrare facilmente i progetti.

I progetti possono essere scalati praticamente ovunque – sia in un data center, sia in un cloud pubblico o in NVIDIA DGX Cloud – e quindi riportati ai sistemi RTX locali su un PC o una workstation per l’inferenza e una leggera personalizzazione.

In collaborazione con HP, NVIDIA sta anche semplificando lo sviluppo di modelli di intelligenza artificiale integrando NVIDIA AI Foundation Models and Endpoints, che include modelli di intelligenza artificiale accelerati da RTX e kit di sviluppo software, in HP AI Studio, una piattaforma centralizzata per la scienza dei dati. Ciò consentirà agli utenti di cercare, importare e distribuire facilmente modelli ottimizzati su PC e cloud.

Dopo aver creato modelli di intelligenza artificiale per i casi d’uso su PC, gli sviluppatori possono ottimizzarli utilizzando NVIDIA TensorRT per sfruttare appieno i Tensor Core delle GPU RTX.

NVIDIA ha recentemente esteso TensorRT alle applicazioni basate su testo con TensorRT-LLM per Windows, una libreria open source per l’accelerazione degli LLM. L’ultimo aggiornamento di TensorRT-LLM, ora disponibile, aggiunge Phi-2 al crescente elenco di modelli pre-ottimizzati per PC, che vengono eseguiti fino a 5 volte più velocemente rispetto ad altri backend di inferenza, sostiene NVIDIA.

Al CES, NVIDIA e i suoi partner sviluppatori hanno rilasciato diverse nuove applicazioni e servizi generativi basati sull’intelligenza artificiale per PC.

NVIDIA RTX Remix è una piattaforma per la creazione di remaster RTX di giochi classici. Rilasciata in beta alla fine del mese, offre strumenti di intelligenza artificiale generativa in grado di trasformare le texture di base dei giochi classici in materiali di rendering moderni, a risoluzione 4K e basati sulla fisica.

I microservizi NVIDIA ACE, che includono modelli di animazione e di parlato basati sull’intelligenza artificiale generativa, consentono agli sviluppatori di aggiungere avatar digitali intelligenti e dinamici ai giochi e alle applicazioni.

L’accelerazione TensorRT per i modelli Stable Diffusion XL (SDXL) Turbo e latent consistency, due dei metodi di accelerazione Stable Diffusion più diffusi. TensorRT migliora le prestazioni di entrambi fino al 60% rispetto alla precedente implementazione più veloce, afferma NVIDIA. È ora disponibile anche una versione aggiornata dell’estensione TensorRT della WebUI di Stable Diffusion, che include l’accelerazione per SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) e un supporto migliorato per LoRA.

NVIDIA DLSS 3 con Frame Generation, che utilizza l’intelligenza artificiale per aumentare il frame rate fino a 4 volte rispetto al rendering nativo, sarà presente in una dozzina dei 14 nuovi giochi RTX annunciati, fra cui Horizon Forbidden West, Pax Dei e Dragon’s Dogma 2.

Chat with RTX, una demo tecnologica di NVIDIA disponibile a partire da questo mese, permette agli appassionati di AI di connettere facilmente gli LLM del PC ai propri dati utilizzando una tecnica molto diffusa nota come retrieval-augmented generation (RAG). La demo, accelerata da TensorRT-LLM, consente agli utenti di interagire rapidamente con i propri appunti, documenti e altri contenuti. Sarà inoltre disponibile come reference project open source, in modo che gli sviluppatori possano facilmente implementare le stesse funzionalità nelle proprie applicazioni.