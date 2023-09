Cloudflare, azienda specializzata nella connettività cloud, ha annunciato una importante novità che consente ora agli sviluppatori di costruire applicazioni AI full-stack sul network di Cloudflare.

La developer platform di Cloudflare fornirà la migliore esperienza end-to-end per gli sviluppatori che creano applicazioni di intelligenza artificiale, abiltando un’inferenza veloce e conveniente senza la necessità di gestire l’infrastruttura.

Poiché ogni azienda, dalle startup alle realtà enterprise, cerca di potenziare i propri servizi con l’intelligenza artificiale, la piattaforma di Cloudflare offre agli sviluppatori la velocità di distribuire rapidamente un’applicazione pronta per la produzione, con sicurezza, conformità e velocità integrate.

I leader aziendali, dalle aziende Fortune 1000 che desiderano potenziare i propri servizi con l’intelligenza artificiale alle startup di intelligenza artificiale al lavoro per creare la prossima applicazione che definirà la cultura, vogliono lanciare applicazioni alimentate dall’intelligenza artificiale su production-scale, sottolinea Cloudflare. Le organizzazioni cercano di muoversi rapidamente per realizzare rapidamente il valore.

Tuttavia, devono affrontare sfide come la rapida crescita dei costi, l’opacità dell’implementazione dell’AI e la garanzia che i dati dei clienti rimangano privati e conformi alle normative. Gli sviluppatori si trovano di fronte a una serie di nuovi fornitori, che li obbligano a comprendere rapidamente nuovi strumenti e a collegare tra loro molti servizi complessi e disparati. I dirigenti aziendali di alto livello cercano di ottimizzare i costi tra tecnologie, strumenti e personale costosi.

“Cloudflare dispone di tutte le infrastrutture di cui gli sviluppatori hanno bisogno per creare applicazioni scalabili basate sull’intelligenza artificiale e ora può fornire l’inferenza dell’intelligenza artificiale il più vicino possibile all’utente. Stiamo investendo per rendere più semplice per ogni sviluppatore l’accesso a strumenti potenti e convenienti per costruire il futuro“, ha dichiarato Matthew Prince, CEO e co-fondatore di Cloudflare. “Workers AI consentirà agli sviluppatori di creare esperienze di intelligenza artificiale pronte per la produzione in modo efficiente e conveniente e in pochi giorni, invece di impiegare settimane o addirittura mesi per interi team“.

Cloudflare presenta Workers AI come la prima piattaforma AI Serverless su scala industriale. Workers AI offre agli sviluppatori un modo semplice e conveniente per eseguire modelli di intelligenza artificiale sulla rete globale di Cloudflare.

Grazie a importanti partnership, Cloudflare fornirà ora l’accesso alle GPU in esecuzione sull’ampia rete globale di Cloudflare per garantire che l’inferenza dell’AI possa avvenire vicino agli utenti per un’esperienza a bassa latenza. In combinazione con la Data Localization Suite di Cloudflare, che consente di controllare il luogo in cui i dati vengono ispezionati, Workers AI aiuterà i clienti ad anticipare i potenziali requisiti di conformità e regolamentazione che potrebbero sorgere man mano che i governi creano politiche sull’uso dell’AI.

L’approccio privacy-first di Cloudflare allo sviluppo delle applicazioni può aiutare le aziende a mantenere le promesse fatte ai clienti, garantendo che i dati utilizzati per l’inferenza non vengano utilizzati per l’addestramento degli LLM. Attualmente Cloudflare supporta un catalogo di modelli per aiutare gli sviluppatori a iniziare rapidamente, con casi d’uso che includono LLM, speech to text, classificazione delle immagini, sentiment analysis e altro ancora.

Il nuovo database vettoriale di Cloudflare, Vectorize, consente agli sviluppatori di costruire applicazioni AI full-stack interamente su Cloudflare: dalla generazione degli embeddings con i modelli integrati in Workers AI e la loro indicizzazione in Vectorize, alla loro interrogazione e all’archiviazione dei dati sorgente in R2. Con Workers AI e Vectorize, sottolinea Cloudflare, gli sviluppatori non devono più assemblare più pezzi insieme per potenziare le loro app con l’intelligenza artificiale e l’apprendimento automatico: possono fare tutto su un’unica piattaforma.

Vectorize beneficia anch’esso della rete globale di Cloudflare, che consente di eseguire le query vettoriali più vicino agli utenti, riducendo la latenza e il tempo complessivo di inferenza. Si integra inoltre con il più ampio ecosistema AI, consentendo agli sviluppatori di memorizzare gli embedding generati con OpenAI e Cohere, in modo che i team possano portare gli embedding che già possiedono e beneficiare comunque di Vectorize quando si tratta di scalare le app di AI in produzione.

Cloudflare ha inoltre annunciato AI Gateway per rendere le applicazioni AI più affidabili, osservabili e scalabili. Secondo le ultime previsioni di IDC, la spesa per l’intelligenza artificiale dovrebbe salire a 154 miliardi di dollari quest’anno e aumentare a oltre 300 miliardi nel 2026. Tuttavia, gli sviluppatori e i dirigenti aziendali non hanno modo di capire come viene speso il denaro nell’infrastruttura di AI, né quante e da dove vengono effettuate le query.

Gli sviluppatori dovrebbero potersi concentrare su ciò che stanno costruendo, sottolinea Cloudflare, non sull’infrastruttura, sulla scalabilità, sui costi o sull’osservabilità che c’è dietro. AI Gateway offrirà agli sviluppatori funzioni di osservabilità per comprendere il traffico dell’intelligenza artificiale, come il numero di richieste, il numero di utenti, il costo di gestione dell’applicazione e la durata delle richieste.

Inoltre, gli sviluppatori possono gestire i costi con il caching e il rate limiting. Con il caching, i clienti potranno memorizzare nella cache le risposte a domande ripetute, riducendo la necessità di effettuare costantemente più chiamate alle costose API. Il rate limiting aiuterà a gestire gli attori malintenzionati e il traffico intenso per gestire la crescita e i costi, dando agli sviluppatori un maggiore controllo sulle modalità di scalabilità delle loro applicazioni.