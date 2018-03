Intelligenza artificiale e machine learning promettono di trasformare radicalmente molte industrie, ma comportano anche rischi, molti dei quali devono ancora essere scoperti, dato che la tecnologia sta cominciando solo ora a essere implementata in modo significativo.

Vi sono già stati numerosi esempi imbarazzanti, come il chabot per Twitter, Tay di Microsoft passato da innocente chatbot a strumento razzista in un solo giorno.

Due anni fa, Google ha dovuto censurare le ricerche di immagini per parole chiave come "gorilla" e "scimpanzé" perché restituiva foto di persone. E il problema non è stato ancora completamente risolto nella sua app Google Photos.

L'intelligenza artificiale nella sanità

Il problema è più serio se ci si occupa di sanità. È il caso, per esempio, di KenSci, startup che applica l'Intelligenza artificiale ai dati sanitari.

La piattaforma fornisce raccomandazioni sanitarie ai medici e alle compagnie di assicurazione. Se ci sono errori nelle cartelle cliniche, o nei set di formazione usati per creare modelli predittivi, le conseguenze potrebbero essere potenzialmente fatali, una situazione che mette in luce un fattore di rischio chiave per l'implementazione dell'Intelligenza artificiale: la qualità delle pratiche di gestione dei dati.

KenSci si occupa di milioni di cartelle cliniche dei pazienti presso organizzazioni partner in tutto il mondo. Le informazioni sono redatte in lingue, standard e formati diversi e sono organizzate intorno a diversi schemi di classificazione.

Per affrontare questo problema la società si avvale di strumenti di terze parti, di personale interno e anche di organizzazioni sanitarie partner. Per mitigare i rischi legati all'intelligenza artificiale, KenSci dispone di tre livelli aggiuntivi di sicurezza. In primo luogo, c'è la prima linea di difesa contro gli errori: i medici che forniscono le cure. Questo perché la società crede nell’intelligenza assistiva e lascia quindi ai medici la decisione su come agire.

La piattaforma KenSci fa solamente raccomandazioni. E nella maggior parte dei casi, queste raccomandazioni non sono nemmeno per i trattamenti. La maggior parte del lavoro si concentra sulle previsioni dei costi, l'analisi del flusso di lavoro e le ottimizzazioni del flusso di lavoro.

Gli esperti medici dell'azienda forniscono una seconda linea di difesa, rivedendo i dati in arrivo e i limiti di utilizzo. Ad esempio, i dati provenienti dai risultati dei trattamenti di pazienti maschi potrebbero non applicarsi alle donne. Infine, ci sono peer review esterne sulle realizzazioni dei modelli di KenSci e sui fattori che sono confluiti nelle decisioni della piattaforma.

Questo approccio mostra i di processi che le aziende dovranno mettere in atto per gestire la loro relazione con l’intelligenza artificiale. I dati sono un elemento fondamentale. Tutti i principali progressi dell'Ia sono stati alimentati dai progressi nei set di dati. Google, per esempio, ha finanziato una flotta di auto che hanno guidato e mappato digitalmente ogni strada in America.

Combinano i dati con immagini satellitari e altre fonti, quindi impiegano un team di curatori umani che lucidano manualmente i dati che rappresentano ogni edificio, intersezione e semaforo nel mondo. Poiché l'Ia è applicata a una più ampia gamma di problemi, gli approcci vincenti saranno quelli che riconoscono che il successo non proviene dagli algoritmi, ma dai dati.

Tuttavia, spesso le aziende spesso non si rendono conto dell'importanza di avere buoni dati fino a quando non hanno già avviato i loro progetti di Intelligenza artificiale. Secondo un sondaggio condotto da Forrester l'anno scorso, solo il 17% degli intervistati afferma che la sfida più grande è stata quella di non "avere una raccolta ben curata di dati per formare un sistema di Intelligenza artificiale".

Il problema della disponibilità di tutti i dati

Uno dei maggiori problemi che emergono non è tanto che non ci siano abbastanza dati, ma che i dati siano bloccati e difficilmente accessibili. Il machine learning infatti non funziona se i dati sono rigidamente divisi in silos.

Se i dati finanziari sono in una piattaforma, per esempio, Oracle, quelli HR e i contratti in altre soluzioni e c’è nulla per creare connessioni fra questi silos, la situazione si fa difficile. E a quel punto, l'azienda non è pronta per l’intelligenza artificiale. Anche se si dispone dei dati, si possono ancora incontrare problemi con la loro qualità, così come pregiudizi nascosti all'interno dei set di allenamento.

Diversi recenti studi hanno dimostrato che i set di dati popolari utilizzati per formare il riconoscimento dell'immagine hanno incluso i pregiudizi di genere. Ad esempio, un'immagine di un uomo che cucinava sarebbe stata erroneamente identificata come donna perché nei dati di formazione i cuochi erano donne.

Le aziende che costruiscono sistemi di Intelligenza artificiale devono verificare se i dati e gli algoritmi che li analizzano sono in linea con i principi, gli obiettivi e i valori dell'organizzazione.

Anche dati perfettamente accurati potrebbero essere problematicamente distorti. Se, per esempio, una compagnia di assicurazioni con sede in un Paese ha utilizzato i dati storici per addestrare i suoi sistemi Ia e ha poi ampliato il suo raggio d’azione in un altro il sistema potrebbe non essere utile per prevedere il rischio di terremoti oppure di altre situazioni climatiche più estreme caratteristiche dell'altro Paese.

Il primo passo potrebbe essere di nominare un responsabile dei dati in quanto le aziende che hanno un responsabile dei dati svolgono un lavoro migliore gestendo i loro dati. Oggi la maggior parte delle aziende deve sviluppare le proprie tecnologie per preparare i dati da utilizzare nei sistemi di Intelligenza artificiale e machine learning.