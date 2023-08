L’AI generativa è una tecnologia potente e trasformativa che ha il potenziale per far progredire un’ampia gamma di settori, dalla produzione alla vendita al dettaglio, dai servizi finanziari alla sanità, sottolinea Microsoft, i cui investimenti nell’hardware e nell’infrastruttura Azure per l’intelligenza artificiale stanno aiutando i clienti a realizzare l’efficienza e l’innovazione che l’AI generativa può offrire.

L’infrastruttura Azure AI è la spina dorsale del modo in cui Microsoft scala le sue offerte, con Azure OpenAI Service in prima linea in questa trasformazione, che fornisce agli sviluppatori i sistemi, gli strumenti e le risorse di cui hanno bisogno per creare applicazioni di nuova generazione basate sull’intelligenza artificiale sulla piattaforma Azure. Con l’AI generativa, gli utenti possono creare esperienze d’uso più ricche, alimentare l’innovazione e aumentare la produttività delle loro imprese.

Nell’ambito del suo impegno a portare la potenza trasformativa dell’intelligenza artificiale ai suoi clienti, Microsoft ha annunciato aggiornamenti su come sta potenziando l’infrastruttura e le applicazioni di AI di Azure per le aziende. Con l’espansione globale di Azure OpenAI Service, Microsoft sta rendendo disponibili i modelli più avanzati di OpenAI, GPT-4 e GPT-35-Turbo, in diverse nuove region, offrendo alle aziende di tutto il mondo capacità di AI generativa allo stato dell’arte. La scalabilità è garantita dalla infrastruttura Azure per l’intelligenza artificiale, sulla quale Microsoft sta continuando a investire.

Le nuove region live – Australia East, Canada East, East United States 2, Japan East e United Kingdom South – estendono la reach del servizio e il supporto alle organizzazioni che sono in cerca di potenti capacità di AI generativa. Con l’aggiunta di queste region, Azure OpenAI Service è ora disponibile in un numero ancora maggiore di località, a complemento della disponibilità esistente in East United States, France Central, South Central United States e West Europe.

La risposta ad Azure OpenAI Service, sottolinea Microsoft, è stata finora sorprendente: la base di clienti è quasi triplicata rispetto all’ultima divulgazione e oggi vengono serviti oltre 11.000 clienti, con una media di 100 nuovi clienti al giorno in questo trimestre.

Nell’ambito di questa espansione, Microsoft sta aumentando la disponibilità di GPT-4, il modello di AI generativa più avanzato di Azure OpenAI, nelle nuove region. Questo miglioramento consente a un maggior numero di clienti di sfruttare le capacità di GPT-4 per la generazione di contenuti, la document intelligence, il servizio clienti e altro ancora. Con Azure OpenAI Service, le organizzazioni possono spingere le loro operazioni verso nuovi traguardi, promuovendo l’innovazione e la trasformazione in diversi settori.

Microsoft ha anche annunciato la disponibilità generale della serie di macchine virtuali (VM) Azure ND H100 v5, con le più recenti GPU NVIDIA H100 Tensor Core e il networking NVIDIA Quantum-2 InfiniBand. Questa famiglia di VM è stata meticolosamente progettata grazie alla vasta esperienza di Microsoft nella fornitura di prestazioni di supercomputing e di scala per affrontare la complessità in aumento esponenziale dei carichi di lavoro AI all’avanguardia. Come parte del suo profondo e continuo investimento nell’AI generativa, Microsoft sfrutta un cluster di GPU 4K ottimizzato per l’intelligenza artificiale e nel corso del prossimo anno ha annunciato che arriverà a centinaia di migliaia di GPU di ultima generazione.

ND H100 v5 è ora disponibile nelle region Azure East United States e South Central United States. Le aziende possono registrare il proprio interesse per l’accesso alle nuove macchine virtuali o consultare i dettagli tecnici sulla serie di VM ND H100 v5 su Microsoft Learn.

Le VM ND H100 v5 includono una serie di funzionalità avanzate, sottolinea Microsoft, a partire dalle GPU per il supercomputing AI. Dotate di otto GPU NVIDIA H100 Tensor Core, queste macchine virtuali promettono prestazioni dei modelli AI significativamente più rapide rispetto alle generazioni precedenti, offrendo alle aziende una potenza di calcolo ancora più elevata. Inoltre, offrono CPU di nuova generazione: considerando l’importanza delle prestazioni della CPU per l’addestramento e l’inferenza dell’intelligenza artificiale, Microsoft ha scelto i processori Intel Xeon Scalable di quarta generazione come base per queste VM, per garantire una velocità di elaborazione ottimale.

C’è poi il networking a bassa latenza: l’inclusione di NVIDIA Quantum-2 ConnectX-7 InfiniBand con 400 Gb/s per GPU e 3,2 Tb/s per VM di banda passante tra i vari nodi garantisce prestazioni ininterrotte tra le GPU, in linea con le capacità dei supercomputer più performanti a livello globale. Nonché prestazioni ottimizzate tra host e GPU: grazie a PCIe Gen5 che fornisce una larghezza di banda di 64 GB/s per GPU, Azure ottiene vantaggi significativi in termini di prestazioni tra CPU e GPU.

La memoria DDR5 è il cuore di queste macchine virtuali, che offrono una maggiore velocità di trasferimento dei dati e una maggiore efficienza, rendendole ideali per i carichi di lavoro con dataset di grandi dimensioni.

Queste macchine virtuali – sottolinea Microsoft – hanno dimostrato le loro capacità nelle prestazioni, con una velocità fino a sei volte superiore nelle operazioni di moltiplicazione matriciale quando si utilizza il nuovo tipo di dati in virgola mobile FP8 a 8 bit rispetto all’FP16 delle generazioni precedenti. Le macchine virtuali ND H100 v5 raggiungono una velocità fino a due volte superiore nei modelli linguistici di grandi dimensioni, come l’inferenza del modello end-to-end BLOOM 175B, dimostrando che le loro prestazioni sono molto elevate.