Wikidata: in arrivo la Wikipedia dei dati

Un progetto nato in seno a Wikimedia punta a creare un database di conoscenze utilizzabile da tutti. Fondamentale per allineare le versioni localizzate di Wikipedia.

Creare un database di conoscenze che possa essere usato, vale a dire letto e modificato, sia dagli umani sia dalle macchine: è questo, in sintesi estrema, l’ambizioso obiettivo che si cela dietro il progetto Wikidata.

Si tratta di un progetto nato in seno a Wikimedia Foundation, le cui fondamenta sono state poste lo scorso febbraio in occasione della Semantic Tech & Business Conference di Berlino e la cui elaborazione, stando a quanto si legge sul sito stesso dell’iniziativa, è iniziata nel mese di aprile con la presentazione di una proposta tecnica.
Oggetto di sviluppo è un database semantico, leggibile anche dalle macchine, che dovrebbe consentire, tra l’altro, di creare una sorta di allineamento tra tutte le versioni localizzate di Wikipedia, rendendo disponibili per ciascuna (si parla di 280 lingue supportate) le stesse informazioni di base, restringendo i gap esistenti tra le versioni inglese, tedesca, francese e olandese e le altre.

Stando alle definizioni di partenza, Wikidata sarà libero, i dati saranno utilizzabili in scenari differenti, collaborativo, grazie al contributo degli editor che si occuperanno dell’inserimento dei dati e della maintenance, multilingue. Conterrà non solo i dati ma anche le loro fonti, a supporto del criterio di verificabilità. I dati saranno raccolti in forma strutturata, cosa che ne faciliterà il riuso e la comprensione da anche da parte dei computer.
Consentirà, per altro, agli utenti, di formulare domande specifiche (ad esempio quale tra le capitali d’Europa ha l’università più antica), andando ben oltre l’offerta attuale di Wikipedia, che si basa su liste create dagli stessi utenti.

Il progetto Wikidata è guidato dal capitolo tedesco di Wikimedia, mentre lo sviluppo è supportato da una donazione dell’Allen Institute for Artificial Intelligence, dalla Gordon and Betty Moore Foundation e da Google.

Quanto alla tabella di marcia, queste settimane sono quelle di primo ingaggio della comunità dei contributor per lo sviluppo del progetto, mentre le modalità di inserimento e consultazione dei dati disponibili per le infobox dovrebbero essere rese pubbliche entro la fine dell’anno, con l’obiettivo di chiudere la prima parte dello sviluppo del progetto entro il mese di marzo del prossimo anno.
Più pragmaticamente, il progetto si articola in tre fasi.
La prima, attualmente in corso, punta alla creazione di una pagina Wikidata per ciascuna voce di Wikipedia, in tutte le 280 lingue supportate. Questo significa che ogni pagina viene tradotta in dati strutturati utilizzabili in tutti gli articoli, a prescindere dalla lingua nella quale sono redatti. Questa prima fase si chiuderà in agosto.
La seconda fase abiliterà gli editor ad aggiungere e utilizzare i dati e si chiuderà a dicembre, mentre la terza fase consentirà la creazione automatica di liste e chart che andranno a popolare Wikipedia.
I dati verranno presentati in box informativi, le infobox, collocate a destra sulla pagina di Wikipedia.

CONDIVIDI

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here