Huawei IDI Forum 2026, la nuova infrastruttura dati full-stack per i data center AI

Huawei Innovative Data Infrastructure (IDI) Forum 2026 (2)

Huawei presenta una nuova infrastruttura dati full-stack per i data center AI, pensata per sostenere l’adozione su larga scala dell’intelligenza artificiale nelle imprese. L’annuncio, arrivato durante lo Huawei Innovative Data Infrastructure Forum 2026, mette al centro un punto ormai decisivo per l’evoluzione dell’AI enterprise: senza una gestione più efficiente, sicura e scalabile dei dati, agenti, modelli e applicazioni intelligenti rischiano di restare limitati da architetture IT non progettate per i nuovi carichi di lavoro.

La proposta di Huawei nasce per accompagnare la costruzione di AI data center, cioè infrastrutture in cui storage, piattaforme dati, potenza di calcolo, modelli, framework per agenti e resilienza devono funzionare come un unico sistema. L’intelligenza artificiale sta infatti cambiando il modo in cui le imprese operano, ma sta anche aumentando in modo significativo la pressione sulle infrastrutture: più applicazioni AI, più agenti, più consumo di token, più dati da archiviare, elaborare, recuperare e proteggere.

Yuan Yuan, Vice President di Huawei e President della Huawei Data Storage Product Line
Yuan Yuan, Vice President di Huawei e President della Huawei Data Storage Product Line

L’intelligenza artificiale sta aprendo nuove opportunità per il settore IT e il futuro di questa tecnologia riguarda soprattutto i dati. L’impegno di Huawei nell’innovazione tecnologica nello storage dei dati ci spinge a consolidare la nostra esperienza nell’adozione dell’AI a livello industriale e a collaborare con l’intero ecosistema per supportare i clienti nell’accelerare il proprio percorso verso l’era intelligente”, ha dichiarato Yuan Yuan, Vice President di Huawei e President della Huawei Data Storage Product Line.

Huawei IDI Forum 2026 mette i dati al centro dell’AI enterprise

Il passaggio dall’AI sperimentale all’AI industriale obbliga le aziende a ripensare l’infrastruttura. Non basta aggiungere capacità di calcolo o adottare nuovi modelli: serve una piattaforma dati capace di sostenere applicazioni multimodali, inferenza su larga scala, memoria contestuale, knowledge base, agenti autonomi e protezione end-to-end degli asset informativi.

Huawei descrive questa evoluzione come una transizione verso infrastrutture dati per AI DC, pianificate attorno a più livelli complementari. Il primo è il data lake AI, pensato per raccogliere e rendere disponibili enormi volumi di dati. Il secondo è la piattaforma dati AI, necessaria per knowledge, memory e inferenza. A questi si aggiungono potenza di calcolo, modelli, framework per agenti e resilienza dei dati.

Il punto più rilevante è l’integrazione. Nei data center AI, il valore non nasce solo dalla somma dei singoli componenti, ma dal modo in cui dati, modelli e risorse di calcolo vengono orchestrati. La crescita degli agenti AI accentua ulteriormente questa esigenza: un agente non deve soltanto rispondere, ma accedere a informazioni affidabili, mantenere memoria, utilizzare strumenti, interagire con sistemi aziendali e operare in condizioni di sicurezza.

Data lake AI e OceanStor Pacific per gestire volumi su scala elevata

Il primo pilastro dell’infrastruttura Huawei è il data lake AI. Al centro c’è lo storage scale-out ad alta densità OceanStor Pacific, che secondo la società offre una capacità di 11 PB in uno spazio di 2U. L’obiettivo è consentire l’archiviazione di grandi volumi di dati con un costo totale di proprietà ottimizzato, una condizione essenziale quando dataset, vettori, contenuti multimodali e log operativi crescono rapidamente.

Accanto allo storage, Huawei introduce DME Omni-Dataverse, una soluzione proprietaria di spazio dati unificato. La piattaforma supporta l’importazione multimodale, multi-sito e in tempo reale dei dati, offrendo visibilità e gestione globale. Secondo Huawei, il sistema consente il recupero in pochi secondi di centinaia di miliardi di vettori a 1.000 dimensioni, con l’obiettivo di garantire aggregazione e disponibilità di dati di qualità elevata.

È un punto tecnico ma molto concreto. Le applicazioni AI non dipendono solo dalla quantità di dati disponibili, ma anche dalla velocità con cui questi dati possono essere trovati, correlati e messi a disposizione dei modelli. Nei casi d’uso enterprise, il retrieval diventa uno snodo cruciale: se il dato corretto arriva tardi, oppure se il sistema non riesce a selezionarlo con sufficiente precisione, l’intera catena AI perde efficacia.

Context Memory Storage e piattaforma AI 3+1 per l’inferenza enterprise

Il secondo pilastro riguarda knowledge e memory, due aree sempre più critiche per l’AI agentica. Per i cluster di inferenza su scala molto ampia, Huawei introduce il primo Context Memory Storage del settore con supporto al computing power eterogeneo. Il CMS supporta il passaggio diretto semantico key-value oppure l’utilizzo di una dedicated data processing unit per l’offloading semantico.

La soluzione può espandersi fino a un pool condiviso di cache KV in scala PB e promette una riduzione del 90% del time to first token. Questo dato è rilevante perché il time to first token incide direttamente sulla percezione di reattività dei sistemi AI. In scenari enterprise, dove più utenti, agenti e applicazioni interrogano modelli e basi di conoscenza, ridurre la latenza iniziale può migliorare l’esperienza e l’efficienza dell’infrastruttura.

Per gli scenari di inferenza AI enterprise, Huawei presenta anche una piattaforma dati AI 3+1 che integra accelerazione della cache KV, una knowledge base con oltre il 95% di accuratezza nel retrieval e una memory bank in continua evoluzione. L’Unified Cache Manager consente scheduling e gestione seamless, con un miglioramento dichiarato del 30% dell’accuratezza dell’inferenza.

La direzione è chiara: l’infrastruttura dati non è più soltanto un livello di supporto, ma diventa parte attiva della qualità dell’AI. Knowledge base, memoria e cache non servono solo a velocizzare le risposte, ma a rendere i sistemi più coerenti, contestuali e utilizzabili nei processi aziendali.

ModelEngine e Nexent per modelli e agenti AI

Il terzo livello riguarda model engineering e resource scheduling. ModelEngine di Huawei offre funzionalità out-of-the-box per l’utilizzo dei modelli e capacità di model gateway, con l’obiettivo di consentire l’adattamento zero-code a nuovi modelli e il deployment con un solo clic. In un mercato in cui le imprese devono gestire modelli diversi, versioni diverse e casi d’uso distribuiti, la riduzione della complessità operativa diventa una leva importante.

Huawei indica anche un lavoro sul partizionamento granulare delle risorse di calcolo e sullo scheduling intelligente. ModelEngine raggiunge un rapporto di partizionamento xPU fino a 1:10, permettendo a una singola xPU di svolgere più funzioni e migliorando l’efficienza delle risorse. È una risposta a un problema molto concreto dei data center AI: non tutte le risorse vengono usate in modo uniforme e la capacità di allocarle dinamicamente può incidere in modo significativo su costi e prestazioni.

Il quarto pilastro è il framework per agenti. ModelEngine Nexent consente di generare agenti attraverso interazioni in linguaggio naturale, semplificando lo sviluppo e riducendo dell’80% i tempi di rollout. La piattaforma prevede inoltre l’ottimizzazione automatica di skill, prompt e memoria, così da consentire agli agenti di evolvere progressivamente.

Questo elemento intercetta una delle tendenze più forti dell’AI enterprise: il passaggio da sistemi che rispondono a sistemi che agiscono. Gli agenti non si limitano a produrre testo, ma devono eseguire task, utilizzare strumenti, mantenere contesto e adattarsi ai processi. Per farlo in modo utile serve una piattaforma che gestisca non solo il modello, ma anche l’intero ciclo di costruzione, orchestrazione e miglioramento dell’agente.

La resilienza dei dati diventa parte dell’architettura AI

L’ultimo pilastro della nuova infrastruttura Huawei riguarda la resilienza dei dati. È un punto che non può essere considerato accessorio. Quando l’AI entra nei processi aziendali, la catena da proteggere si estende: agenti, modelli, piattaforme, infrastrutture, dati di training, basi di conoscenza, memoria e strumenti collegati.

Huawei sottolinea la necessità di una protezione end-to-end contro rischi come uso improprio degli strumenti, data poisoning, manomissioni e attacchi ransomware. La prospettiva è corretta: nell’AI enterprise, la sicurezza non riguarda solo l’accesso ai sistemi o la protezione dello storage, ma anche l’integrità dei dati utilizzati dai modelli e dagli agenti per prendere decisioni o generare output.

Il data poisoning, ad esempio, può compromettere la qualità o l’affidabilità delle risposte. La manomissione dei dati può alterare il comportamento di un sistema. L’abuso degli strumenti collegati agli agenti può trasformare un’automazione utile in un vettore di rischio. Per questo la resilienza dei dati deve essere costruita nella piattaforma, non aggiunta come controllo successivo.

Una piattaforma per accelerare la trasformazione intelligente

La nuova infrastruttura dati full-stack per i data center AI presentata da Huawei si colloca in una fase in cui molte aziende stanno passando da progetti pilota a implementazioni più strutturate di intelligenza artificiale. In questo passaggio, emergono limiti che non dipendono soltanto dai modelli, ma dall’architettura complessiva: dati dispersi, retrieval lento, costi elevati, risorse di calcolo non ottimizzate, mancanza di memoria, governance insufficiente e rischi di sicurezza.

Huawei prova a rispondere con una piattaforma che mette insieme data lake, piattaforma AI per knowledge e memory, model engineering, framework per agenti e resilienza. È una visione ampia, che punta a fare del data center AI non un semplice ambiente di calcolo accelerato, ma un’infrastruttura completa per la trasformazione intelligente delle imprese.

Il valore della proposta dipenderà naturalmente dall’adozione concreta e dalla capacità di integrarsi nei contesti enterprise esistenti. Ma il messaggio tecnologico è coerente con l’evoluzione del mercato: l’AI industriale non si costruisce solo con più potenza computazionale. Si costruisce rendendo i dati più accessibili, più affidabili, più veloci da recuperare e più protetti lungo l’intera catena che collega infrastruttura, modelli e agenti.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome