Neocloud oltre il BMaaS: l’evoluzione necessaria secondo McKinsey

neocloud

La crescita dei neocloud – i provider GPU-as-a-service nati come risposta alla scarsità globale di capacità di calcolo – non è un fenomeno spontaneo. Come ricordano gli analisti di McKinsey, la combinazione di domanda esplosiva e strategie dei produttori di chip ha creato un ecosistema parallelo composto da oltre cento operatori indipendenti, spesso sostenuti da venture capital, private equity e fondi sovrani. Il loro ruolo iniziale è stato quello di colmare un vuoto lasciato dagli hyperscaler, che hanno assorbito la maggior parte delle GPU di fascia alta per i workload più complessi.

Secondo McKinsey, però, il modello che ha permesso ai neocloud di emergere – il Bare Metal as a Service – poggia su basi tutt’altro che solide. I grandi clienti pagano meno di quanto il modello renda sostenibile, la concorrenza spinge al ribasso i prezzi e le marginalità non reggono oscillazioni nell’utilizzo o nei costi del capitale. La vera domanda è se questi provider resteranno soluzioni temporanee oppure potranno diventare un elemento stabile dell’infrastruttura AI globale.

Le origini: quando l’offerta cede alla domanda

L’impennata della richiesta di GPU è stata innescata dall’ascesa dei modelli generativi. Gli hyperscaler, come rileva McKinsey, hanno accaparrato l’intera produzione delle GPU più avanzate, lasciando startup, laboratori e imprese più piccole in difficoltà. I neocloud sono entrati esattamente qui: contratti flessibili, provisioning rapido, configurazioni specializzate e prezzi anche dell’85% inferiori rispetto ai hyperscaler.

La possibilità di costruire cluster GPU senza un’intera tech stack è stata il loro primo vantaggio competitivo: rapidità, time-to-market e capacità di intercettare una domanda inespressa. Tuttavia questa dinamica, come avvertono gli analisti di McKinsey, ricorda molto da vicino ciò che accadde nella Cloud 1.0 era: l’ecosistema può evolvere bruscamente, e in tempi molto più brevi di quanto previsto.

Il BMaaS non è un punto di arrivo

Che cos’è il BMaaS

Il Bare Metal as a Service è un modello in cui un provider offre hardware fisico dedicato – server, GPU, storage – senza il layer software tipico dei cloud tradizionali. Niente virtualizzazione, niente servizi gestiti: il cliente accede direttamente al “ferro”, controlla l’intera configurazione e può sfruttare tutta la potenza disponibile.

È un modello rapido da attivare e molto flessibile, ma ha un limite strutturale: richiede investimenti elevati, margini ridotti e un tasso di utilizzo sempre vicino al massimo per rimanere sostenibile.

Come afferma McKinsey, nessun operatore o investitore considera il BMaaS un modello sostenibile nel lungo periodo. I neocloud dovranno salire nella stack con servizi AI-native: orchestrazione del training, piattaforme di inferenza distribuita, servizi ML gestiti, stack verticali per settori regolamentati, strumenti per sviluppatori. È in queste aree che nascono retention, lock-in e margini paragonabili al software.

Parallelamente la domanda di calcolo continua a crescere. McKinsey stima che training e inference potrebbero richiedere fino a 200 gigawatt di capacità entro il 2030. In un mercato così ampio, qualsiasi provider con rack attivi può trovare clienti, anche riconvertendo GPU deprezzate verso realtà mid-market con esigenze meno estreme.

I produttori di chip, inoltre, hanno un interesse diretto nel mantenere in vita i neocloud: forniscono allocazioni preferenziali, formule di finanziamento e impegni di ritiro della capacità. Un vero e proprio paracadute implicito che, secondo McKinsey, sta contribuendo a evitare un consolidamento troppo rapido.

Il problema di fondo: il BMaaS non regge i conti

I limiti del modello emergono in modo netto. Le analisi di McKinsey indicano margini lordi reali tra il 55% e il 65% prima della svalutazione. Ma basta un utilizzo sotto l’80% o una lieve erosione del prezzo per azzerare i ritorni. A questo si aggiunge un ciclo di rilascio dei chip sempre più veloce: ogni nuova generazione accelera la svalutazione delle GPU precedenti, comprimendo ulteriormente la finestra di recupero dell’investimento.

La dipendenza da pochi clienti è un altro rischio strutturale. McKinsey segnala che alcuni neocloud generano oltre metà dei ricavi da un singolo hyperscaler: una condizione utile per la credibilità verso gli investitori, ma estremamente vulnerabile in caso di riduzione della domanda o di cambiamenti nelle strategie di sourcing.

Una strada stretta: evolvere senza sfidare direttamente gli hyperscaler

Il paradosso è evidente: i neocloud devono salire nella stack per sopravvivere, ma così facendo entrano in concorrenza con gli stessi hyperscaler che oggi sono tra i loro principali clienti. Una dinamica molto simile, sottolinea McKinsey, a quella che travolse i cloud provider della prima generazione: molti vennero assorbiti, marginalizzati o confinati in nicchie specifiche.

Da qui derivano tre percorsi realistici.

Niche compute: sovranità, specializzazione, latenza estrema

Le nicchie più promettenti sono quelle dove i hyperscaler sono meno efficaci o meno desiderati: compute sovrano, workload altamente regolamentati, casi d’uso con latenza ultra-bassa. In questi contesti, McKinsey evidenzia che vicinanza geografica, personalizzazione e controllo dei dati possono costituire barriere d’ingresso solide.

Restare vicino alle startup e crescere con loro

Un’altra strategia sostenibile è diventare il partner preferenziale delle startup AI. Offrendo compute fin dalle prime fasi, i neocloud possono costruire relazioni che spesso si mantengono anche quando queste aziende diventano piattaforme da miliardi. McKinsey sottolinea che questo tipo di fedeltà è difficile da replicare per gli hyperscaler ed è una leva potente per entrare nel mercato enterprise AI-native.

Consolidamento: destino inevitabile per molti

Come già accaduto in passato, una parte significativa dei neocloud sarà assorbita da hyperscaler, telco o soggetti sovrani. Altri potrebbero uscire dal mercato una volta attenuata la scarsità di GPU. La differenza la farà la capacità, evidenzia McKinsey, di trasformare un vantaggio iniziale in una differenziazione duratura.

La domanda finale: parentesi o nuova categoria dell’infrastruttura AI?

I neocloud sono a un bivio. La loro sopravvivenza dipenderà dalla rapidità con cui riusciranno a evolvere oltre il ruolo di fornitore tampone. Chi saprà combinare capacità industriale, stack software e nicchie ad alta barriera d’ingresso potrà diventare un nuovo layer dell’infrastruttura AI. Gli altri rischiano di replicare la parabola dei provider cloud della prima generazione: utili nella transizione, ma destinati a essere riassorbiti o marginalizzati.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome