Nel panorama in continua evoluzione delle scienze biomolecolari, l’integrazione di modelli di intelligenza artificiale (IA) di ampia portata sta rivoluzionando la ricerca genomica. Un esempio emblematico di questa trasformazione è rappresentato da Evo 2, un modello di IA di nuova generazione sviluppato attraverso una collaborazione tra l’Arc Institute, l’Università di Stanford e NVIDIA. Questo modello, costruito utilizzando la piattaforma NVIDIA DGX Cloud su Amazon Web Services (AWS), offre una comprensione approfondita del codice genetico attraverso diverse specie, aprendo nuove strade nella ricerca su DNA, RNA e proteine.
Evo 2: un modello fondamentale per la genomica
Evo 2 si distingue come il più grande modello di IA pubblicamente disponibile per l’analisi dei dati genomici. Addestrato su un dataset monumentale di quasi 9 trilioni di nucleotidi—i mattoni fondamentali di DNA e RNA—Evo 2 è progettato per applicazioni biomolecolari avanzate. Le sue capacità includono la previsione della struttura e della funzione delle proteine basate sulla sequenza genetica, l’identificazione di nuove molecole per applicazioni sanitarie e industriali, e la valutazione dell’impatto delle mutazioni genetiche sulla funzionalità proteica.
Secondo Patrick Hsu, cofondatore e ricercatore principale dell’Arc Institute, nonché professore assistente di bioingegneria presso l’Università della California, Berkeley, “Evo 2 rappresenta una pietra miliare significativa nella genomica generativa. Avanzando la nostra comprensione di questi componenti fondamentali della vita, possiamo perseguire soluzioni in ambito sanitario e scientifico ambientale che oggi sono inimmaginabili.”
Accessibilità e personalizzazione tramite NVIDIA BioNeMo
Evo 2 è reso disponibile alla comunità scientifica globale attraverso la piattaforma NVIDIA BioNeMo, che offre servizi di microservizi NVIDIA NIM per una distribuzione dell’IA sicura ed efficiente. Questa integrazione consente agli sviluppatori di generare una varietà di sequenze biologiche, con la possibilità di regolare i parametri del modello in base alle esigenze specifiche della ricerca. Per coloro che desiderano personalizzare ulteriormente Evo 2 utilizzando propri dataset proprietari, il modello è accessibile tramite il framework open-source NVIDIA BioNeMo, una raccolta di strumenti di calcolo accelerato dedicati alla ricerca biomolecolare.
Brian Hie, professore assistente di ingegneria chimica all’Università di Stanford e membro dell’Arc Institute, sottolinea l’importanza di Evo 2 nell’accelerare la progettazione biologica: “La progettazione di nuove entità biologiche è stata tradizionalmente un processo laborioso e imprevedibile. Con Evo 2, rendiamo la progettazione biologica di sistemi complessi più accessibile ai ricercatori, permettendo la creazione di nuove e utili innovazioni in una frazione del tempo precedentemente necessario.”
Collaborazione e risorse computazionali avanzate
L’Arc Institute, fondato nel 2021 con un finanziamento iniziale di 650 milioni di dollari, si dedica a supportare la ricerca scientifica a lungo termine, offrendo ai ricercatori finanziamenti pluriennali e infrastrutture all’avanguardia. Questa struttura unica consente agli scienziati di concentrarsi su progetti complessi senza l’onere costante della ricerca di finanziamenti. La collaborazione con NVIDIA ha ulteriormente potenziato le capacità dell’istituto, fornendo accesso a cluster di calcolo ad alte prestazioni tramite NVIDIA DGX Cloud su AWS. Questo ambiente computazionale avanzato ha accelerato significativamente lo sviluppo e l’addestramento di Evo 2, permettendo analisi di dataset di dimensioni senza precedenti e ottenendo risultati in tempi ridotti.
Evo 2: applicazioni trasversali nelle scienze biomolecolari
Evo 2 offre potenzialità applicative che si estendono oltre la ricerca di base, abbracciando settori come la sanità, la biotecnologia agricola e la scienza dei materiali. Grazie alla sua architettura innovativa, il modello è in grado di elaborare sequenze genetiche di lunghezza fino a un milione di token, facilitando l’analisi di genomi complessi e la progettazione di proteine con funzioni specifiche. Questa capacità di interpretare e generare sequenze biologiche complesse apre la strada a scoperte rivoluzionarie, come lo sviluppo di terapie mirate per malattie genetiche, la creazione di colture agricole più resistenti e l’ingegnerizzazione di materiali con proprietà innovative.
L’introduzione di Evo 2 rappresenta un passo significativo nell’integrazione dell‘intelligenza artificiale nelle scienze biomolecolari. La combinazione di risorse computazionali avanzate, collaborazioni interdisciplinari e l’accessibilità attraverso piattaforme come NVIDIA BioNeMo posiziona Evo 2 come uno strumento cruciale per la comunità scientifica. Le sue applicazioni promettono di accelerare la ricerca e l’innovazione in vari campi, contribuendo a risolvere sfide complesse e a migliorare la qualità della vita attraverso avanzamenti scientifici e tecnologici.






