Montepaschi difende i bancomat con il deep learning

C’è il Montepaschi le cui vicende sono state abbondantemente narrate nelle pagine finanziarie e di cronaca dei giornali. È c’è il Montepaschi che ha continuato a lavorare immaginando soluzioni di deep learning che portano molto avanti la banca senese.

È un trio quello che si è mosso attorno al progetto dove da una parte c’è Seco, partner di Intel, dall’altra l’università di Siena e, infine, Carlo Festucci, responsabile della sicurezza di Mps.

Deep learning per la sicurezza

Festucci ci ha spiegato la necessità della banca di “cambiare il paradigma della filiale”.

Per questo è stata realizzata la simulazione di una filiale all’interno di un datacentere su questo abbiamo immaginato nuove soluzioni passando da una sicurezza passiva a una attiva. Lo abbiamo fatto – prosegue il responsabile della security - immaginando di connettere tutte le soluzioni all’interno della filiale e cercando di corrlare le informazioni che arrivavano dai sensori per prevenire i fenomeni prima che avvenissero”.

La traduzione di tutto questo significa che negli anni in Italia si è assistito a un calo delle rapine alle banche, ma a un incremento degli attacchi agli Atm, i bancomat. Secondo i dati dell’Ossif, il Centro di ricerca sulla Sicurezza anticrimine dell’Associazione bancaria italiana, il numero delle rapine in banca negli ultimi 15 anni è passato da un livello 100 a 24, mentre gli attacchi ai bancomat da 100 sono arrivati a 185. “Si tratta di attacchi molto diversi tra loro – osserva Festucci –. Si passa dall’auto che sfonda l’Atm al tentativo di collegarsi ai sistemi interni. Le soluzioni di videosorveglianza attuali non sono sufficienti a constarli per questo abbiamo bisogno di altro”.

Telecamere di profondità

Qui interviene l’università di Siena con Antonio Rizzo, professore di Psicologia Generale, che con i suoi ricercatori inizia a studiare come “discriminare fra comportamenti leciti e illeciti”. Il primo pezzo della soluzione arriva con l’utilizzo delle telecamere di profondità “che riescono a percepire l’immagine in tre dimensioni. Abbiamo scelto la soluzione real sensitive di Intel perché possiede un versatile e potente sistema di sviluppo e permette di embeddare la tecnologia all’interno dei bancomat”. Questo ha permesso di sperimentare soluzioni per monitorare  l’attività a corto e lungo raggio. “Una possibilità molto utile perché quando siamo partiti non sapevamo ancora come avremmo potuto discriminare i comportamenti in tempi molto rapidi, nell’ordine di pochi secondi, da quando la figura entra nel campo visivo”.

Convolutional neural network

Per raggiungere l’obiettivo “ci siamo serviti di un sistema di deep learning e in particolare di quello definito convolutional neural network che cerca di replicare in maniera artificiale il sistema visivo dei mammiferi, formidabile per la capacità di estrarre informazioni rilevanti dalle scene. Il sistema – aggiunge Rizzo - imita questo tipo di strategia cercando di individuare piccoli contrasti orientati nello spazio e costruendo delle immagini. Questo avviene andando a creare  contrasti orientati che cambiano gradualmente lungo l’asse della percezione visiva e così si creano diverse tipi di immagini che individuano gli elementi salienti di un immagine estraendo gli elementi che fanno la differenza”.

Il processo viene ripetuto più volte con più passaggi di compressione per fare emergere componenti salienti e catturare l’essenza dell’immagine visiva. Il risultato consiste nell’emersione di caratteristiche salienti come occhi, ciglie e altre informazioni che passano alle rete neurale addestrata per poter discriminare i comportamenti “in modo migliore rispetto all’uomo perché riescono a percepire cose nel campo del visibile che noi non riusciamo a fermare”.

Grazie alla profondità delle telecamere possiamo anche individuare i pattern di comportamento impliciti e andando a estrapolare i dati questi importano informazioni sulla dinamica dell’evoluzione nel tempo della figura. In laboratorio il sistema è stato addestrato a comportamenti leciti e illeciti applicando anche una soluzione che elimina tutte le immagini statiche esaltando le caratteristiche salienti del movimento.

Questo ha permesso di creare un modello che, con l’ausilio del supercomputer di Barcellona, è stato testato in laboratorio con persone diverse e risultati con un livello di accuratezza sul singolo frame, circa 20 millisecondi, al massimo del 95%. “Ma non basta”. Un ulteriore passaggio, l’applicazione di un layer bayesiano, ha portato, sempre in laboratorio, a “ottenere una prestazione eccezionale con più di mille attacchi, neanche un falso allarme e nessun comportamento illecito rilevato”. Adesso Montepaschi è in attesa dell’ok del Garante della privacy per avere il permesso di sperimentare la soluzione sul campo.

 

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche iscriviti alla newsletter gratuita.
CONDIVIDI