Amazon Aws ha annunciato una collaborazione in corso con Nvidia per portare un’istanza di Amazon Elastic Compute Cloud (Amazon EC2) basata su processore Arm e accelerata da GPU Nvidia nel cloud nella seconda metà del 2021.

Questa istanza, ha spiegato la società di Seattle, sarà caratterizzata dal processore Aws Graviton2 basato su Arm, che è stato costruito da zero da AWS e ottimizzato per il modo in cui i clienti eseguono i loro carichi di lavoro nel cloud, eliminando numerosi componenti non necessari solitamente presenti in un processore general-purpose.

In occasione della conferenza GTC 21 (GPU Technology Conference) anche Nvidia, insieme a molte altre novità, ha sottolineato il suo impegno per i data center, il cloud computing e sulla piattaforma Arm, mettendo in evidenza proprio la partnership con Amazon AWS.

Per quanto riguarda Amazon, Aws nel 2018 è stato tra i primi provider di peso a offrire istanze basate su Arm nel cloud. Le istanze EC2 A1 potenziate da processori Aws Graviton sono costruite intorno ai core Arm e fanno ampio uso del silicio custom di AWS. Sono indicate per i workload scale-out in cui è possibile condividere il carico su un gruppo di istanze più piccole.

Nel 2020 AWS ha rilasciato la seconda generazione, con i processori Graviton2 progettati da AWS e basati sull’architettura Arm a 64 bit, che offrono un importante salto di prestazioni e capacità rispetto ai Graviton di prima generazione.

Questi processori alimentano le istanze EC2 general purpose (M6g, M6gd, T4g), compute-optimized (C6g, C6gd, C6gn) e memory-optimized (R6g, R6gd, X2gd) e forniscono, dichiara AWS, fino al 40% di prestazioni migliori rispetto alle istanze comparabili basate su x86 della generazione attuale, per un’ampia varietà di carichi di lavoro.

I processori AWS Graviton2 offrono sette volte più performance, quattro volte più core di calcolo, una memoria cinque volte più veloce e cache due volte più grandi rispetto ai processori AWS Graviton di prima generazione.

Inoltre, i processori Aws Graviton2 sono supportati dai più popolari sistemi operativi Linux, tra cui Amazon Linux 2, Red Hat, SUSE e Ubuntu. Anche molte delle applicazioni e dei servizi più richiesti supportano le istanze basate su AWS Graviton2.

Gli sviluppatori Arm possono usare queste istanze per costruire applicazioni nativamente nel cloud, eliminando così la necessità di utilizzare emulazione e cross-compilazione, che sono soggette a errori e richiedono molto tempo.

L’aggiunta di GPU Nvidia accelera le istanze basate su Graviton2 per diversi carichi di lavoro cloud, come ad esempio l’inferenza del machine learning.

I clienti che eseguono modelli di machine learning in produzione, ha sottolineato Amazon Aws, sono continuamente alla ricerca di modi per ridurre i costi.

Aws mette infatti in evidenza il fatto che l’inferenza di machine learning può rappresentare fino al 90% della spesa complessiva per l’infrastruttura, per l’esecuzione di queste applicazioni su scala.

Con questa nuova offerta, AWS ritiene che i clienti saranno in grado di sfruttare i vantaggi in termini di prezzo/prestazioni di Graviton2 per implementare modelli di deep learning accelerati dalla GPU a un costo significativamente inferiore rispetto alle istanze basate su x86 con accelerazione GPU.