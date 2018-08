Le migliori organizzazioni IT misurano attentamente le prestazioni e la disponibilità dei servizi e delle applicazioni. Ma se le app sono eseguite nel cloud, i componenti critici vengono spesso erogati da una terza parte. In caso di disservizio o di prestazioni non all’altezza, come si fa a sapere qual è il problema? È nel codice, nella rete o nel provider? E se il problema è del provider, come convincerlo a risolvere il più rapidamente possibile?

Nel caso di Google Cloud, l’azienda offre una visione trasparente di come vengono gestite le prestazioni. Il cliente può avere un quadro della piattaforma Google Cloud così come la “sperimenta” la sua applicazione. Lo spiega in dettaglio Platform di Jay Judkowitz, Sr. Product Managerdi Google Cloud in un post sul blog della società.

Uno sguardo dentro Google Cloud

Google Cloud, racconta Jay Judkowitz, offre rapporti dettagliati delle oltre 130 API del servizio. Inoltre l’azienda ha introdotto Transparent SLIs (Service Level Indicators), un sistema di monitoraggio dei servizi di Google Cloud.

Questo offre un quadro dettagliato sul comportamento dei servizi di Google Cloud Platform (GCP) in relazione ai carichi di lavoro. I dati sono visualizzati nelle dashboard di Stackdriver Monitoring. Sono gli stessi tipi di dati utilizzati dagli SRE per mantenere i servizi Google up and running.

Le metriche di Transparent SLI vanno ben oltre il semplice monitoraggio up/down dei servizi. È possibile eseguire il debug delle più piccole interazioni tra l'applicazione e il servizio, dalle metriche Stackdriver.

Tra queste il numero di transazioni inviate, il rate dei vari codici di risposta e la distribuzione della latenza. Per ciascun servizio è possibile suddividere le metriche in base a una serie di attributi.

Mediante Metrics Explorer di Stackdriver è possibile sfogliare le metriche Transparent SLI. Così come raggrupparle e filtrarle attraverso la stessa serie di attributi, visualizzando statistiche di vario tipo. Quando troviamo una vista particolarmente utile, possiamo salvare il grafico su una dashboard custom di Stackdriver, per visualizzarla ancora.

Trasparenza e visibilità

Transparent SLI consente di evidenziare se i servizi Google si comportano in modo anomalo per il traffico dell’app. E permette di accelerare il processo di smistamento dei problemi. Inoltre, nella comunicazione con il supporto tecnico di Google, è possibile fare riferimento a questi grafici. Abbreviando il tempo di triage con il supporto tecnico, è possibile ridurre anche i tempi di risoluzione.

Google ritiene che una visibilità e una trasparenza così dettagliate possano anche cambiare l’approccio ai servizi stessi. Metriche con grana così fine possono aiutare a comprendere meglio il comportamento dell’applicazione e dei servizi.

E che tale trasparenza sulle metriche possa migliorare l’esperienza nei rapporti con il supporto tecnico Google. E anche aumentare la fiducia dei clienti in Google Cloud.

Maggiori informazioni sono disponibili anche in questo post di approfondimento sull’SRE (Site Reliability Engineering), oltre che sulle pagine dedicate a Transparent SLI.

Il video, dal Cloud Next 18, mostra come Snapchat ha integrato i Transparent SLIs nelle sue dashboard.