Con Google Distributed Cloud ora si può eseguire Gemini ovunque, anche on-premises

Google Cloud

In occasione del suo summit a Singapore, Google Cloud ha annunciato la disponibilità generale di Gemini sull’appliance completamente disconnessa (air-gapped) Google Distributed Cloud (GDC) e la disponibilità in preview di Gemini su Google Distributed Cloud. 

I modelli più avanzati di Google sono ora accessibili alle aziende direttamente all’interno delle loro infrastrutture on-premises, dai propri data center. Questo rende possibili numerose applicazioni concrete per le imprese:

  • Rafforzamento della collaborazione internazionale: eliminazione delle barriere linguistiche e maggiore efficienza operativa.
  • Decisioni più rapide: analisi automatizzata di documenti ed estrazione di insight dai dati proprietari.
  • Miglioramento della customer experience: sviluppo di chatbot intelligenti e assistenti virtuali per clienti e collaboratori.
  • Accelerazione dello sviluppo software: generazione automatizzata di codice e rilevamento proattivo di bug.
  • Maggiore conformità: filtraggio automatico dei contenuti inappropriati e rispetto delle normative di settore.

Google Cloud ha condiviso di avere già ricevuto i primi riscontri ricevuti dai clienti, tra cui il Centre for Strategic Infocomm Technologies (CSIT) di Singapore, la Government Technology Agency of Singapore (GovTech Singapore), la Home Team Science and Technology Agency (HTX), KDDI e Liquid C2, che sfrutteranno i vantaggi dell’AI generativa con Gemini su GDC.

Per generare valore aziendale con l’AI generativa – sottolinea Google Cloud – non basta un semplice modello: occorre una piattaforma completa che includa un’infrastruttura IA scalabile, una libreria con i modelli fondamentali più recenti, servizi di inferenza ad alte prestazioni e agenti IA predefiniti come Agentspace Search. GDC offre tutto questo e molto altro con uno stack IA end-to-end che combina la infrastruttura IA di ultima generazione di Google Cloud con la potenza dei modelli Gemini per accelerare e migliorare tutti i carichi di lavoro IA dei clienti.

Questa piattaforma completa ed end-to-end, afferma Google, offre innanzitutto prestazioni su larga scala: GDC utilizza i più recenti acceleratori GPU NVIDIA, tra cui le GPU NVIDIA Hopper e Blackwell. Un endpoint Gemini completamente gestito è disponibile all’interno del data center di un cliente o partner, offrendo un’esperienza di aggiornamento senza interruzioni e senza intervento manuale. Le elevate prestazioni e la disponibilità sono garantite dal load balancing automatico del carico e dall’auto-scaling dell’endpoint Gemini, gestiti dal load balancer L7 e dalle funzionalità avanzate di fleet management.

La piattaforma offre inoltre fondamenti di sicurezza e controllo: la sicurezza è una componente fondamentale della soluzione GDC, sottolinea Google Cloud, con funzionalità di audit logging e controllo degli accessi che garantiscono la massima trasparenza per i clienti. Ciò consente loro di monitorare tutto il traffico dati in entrata e in uscita dal proprio ambiente AI on-premises e di soddisfare rigorosi requisiti di conformità. La piattaforma offre anche il supporto Confidential Computing sia per le CPU (con Intel TDX) che per le GPU (con NVIDIA Confidential Computing) per proteggere i dati sensibili e prevenire manomissioni o esfiltrazioni.

Infine, flessibilità e velocità per la strategia di IA del cliente: la piattaforma supporta una varietà di modelli leader del settore, tra cui Gemini 2.5 Flash e Pro, modelli Vertex AI specifici per attività (traduzione, riconoscimento ottico dei caratteri, conversione da voce a testo e generazione di embedding) e modelli Gemma open source di Google. GDC fornisce anche VM gestite (VM A3 e A4) e cluster Kubernetes, offrendo ai clienti la possibilità di implementare qualsiasi modello di IA open source o custom e carichi di lavoro di IA personalizzati di loro scelta. A ciò si aggiungono i servizi Vertex AI che forniscono una piattaforma IA end-to-end che include un motore di servizio gestito, connettori di dati e agenti predefiniti come Agentspace search (in anteprima) per un’esperienza di ricerca unificata tra i dati on-premises.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome