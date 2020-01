Dataset Search di Google è stato disponibile in versione beta per circa un anno, per dare modo agli utenti di provare il servizio e di fornire il feedback utile a metterlo a punto.

Si tratta di uno strumento che consente di ricercare tra milioni di set di dati su quasi tutti gli argomenti, disponibili sul web. Dataset Search, ha informato Google, ne ha indicizzati quasi 25 milioni di questi set di dati, e ora offre la possibilità di effettuare ricerche da un una posizione singola, per trovare i collegamenti giusti a dove si trovano i dati.

Dopo un anno di fase test, Google ha ora annunciato che Dataset Search è ufficialmente fuori dal periodo beta.

Diventa quindi uno strumento ufficialmente “finito”, ma, sottolinea la società di Mountain View, ciò non toglie che Google continuerà a migliorare il prodotto, indipendentemente dal fatto che continui o meno ad avere la dicitura "beta" nel nome.

Durante le prove del periodo beta, e sulla base del feedback offerto dagli utenti di Dataset Search, Google ha aggiunto nuove funzionalità a questo servizio.

È ora possibile filtrare i risultati in base ai tipi di set di dati desiderati, come ad esempio tabelle, immagini o testo; oppure, in base al fatto se il dataset è reso disponibile gratuitamente dal provider.

Se un set di dati riguarda un'area geografica, è possibile visualizzare la mappa. Inoltre, Dataset Search è ora disponibile su dispositivi mobili e Google ha migliorato la qualità delle descrizioni dei set di dati.

Chiunque pubblichi dati, evidenzia Google, può rendere i propri dataset ricercabili in Dataset Search, utilizzando uno standard aperto (schema.org) per descrivere le proprietà del set di dati sulla propria pagina web.

Google ha offerto anche uno spaccato di quali sono le tipologie di utenti che eseguono solitamente ricerche di dataset. Ci sono ricercatori accademici, studenti, analisti aziendali, data scientist e altri, su argomenti delle più svariate categorie.

Google ha poi messo in evidenza che i principali argomenti trattati dai set di dati sono: geoscienze, biologia e agricoltura. La maggior parte dei governi pubblica i propri dati e li descrive con schema.org. Gli Stati Uniti, prosegue l’analisi di Google, guidano la classifica nel numero di set di dati governativi aperti disponibili, con oltre 2 milioni. I formati di dati più popolari sono le tabelle: se ne possono trovare più di 6 milioni in Dataset Search.

Per cercare un set di dati in Dataset Search, basta effettuare una query nel motore di ricerca sul web.