Supporto Hive-on-Spark nella 5.7 di Cloudera Enterprise

È un miglioramento medio di tre volte superiore per l’elaborazione dei dati con il supporto aggiuntivo di Hive-on-Spark, e un miglioramento medio di due volte superiore per le analisi di business intelligence con aggiornamenti per Apache Impala quello promesso dalla versione 5.7 di Cloudera Enterprise.
Nella sua ultima release, il fornitore globale della piattaforma di analisi e gestione dei dati basata su Apache Hadoop ha aggiunto visibilità sull’utilizzo multi-tenant dei carichi di lavoro a ulteriore conferma della crescita di Hadoop per il quale Cloudera prevede nuove applicazioni e casi d’uso.

Per carichi di lavoro anche su larga scala

In tal senso, l’avanzamento della progettazione dei dati e lo sviluppo ETL con Hive-on-Spark è volto a rafforzare ulteriormente il posizionamento di Spark quale motore standard per l’elaborazione dei dati in Hadoop.
Come già definito un anno fa, con il lancio della One Platform Initiative come roadmap per completare il processo di transizione da MapReduce a Spark, il rilascio di Hive-on-Spark in Cloudera 5.7 porta Spark più vicino agli sviluppatori che possono ora sfruttare le potenti capacità di elaborazione dei dati di Spark, pur continuando a utilizzare Hive, con prestazioni triplicate.
A testimoniarlo ci pensa l’ecosistema rappresentato da oltre 2.300 partner, tra cui BMC, ClearStory Data, Elastic, NGDATA, Solix, Trillium Software, Zementis e altri, con il quale Cloudera ha lavorato per garantire ai clienti la possibilità di continuare a utilizzare gli strumenti principali per l’integrazione dei dati e di preparazione con Hive-on-Spark, senza interrompere l’attività aziendale.

Piena visibilità su utilizzo passato, efficienza, tenant e applicazioni

Essere in grado di supportare molteplici casi d’uso attraverso gli stessi dati condivisi all’interno di un singolo cluster rappresenta, infatti, un vantaggio fondamentale per Hadoop.
Da qui la proposizione di Cloudera Enterprise, con la quale gli amministratori possono fornire a utenti e applicazioni le risorse corrette da utilizzare per soddisfare anche gli SLA più critici.
Inoltre, la nuova funzionalità di reporting di utilizzo del cluster, incorporata in Cloudera Manager, promette operazioni efficienti e la corretta allocazione delle risorse tra gruppi e tipologie di carico di lavoro per risolvere le problematiche legate alle prestazioni di lavoro e alle query.

 

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche iscriviti alla newsletter gratuita.

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here