Amazon Web Service (AWS) ha annunciato una nuova funzione di Amazon Comprehend per l’elaborazione intelligente dei documenti (IDP, intelligent document processing).

Questa funzione consente di classificare ed estrarre entità da documenti PDF, file Microsoft Word e immagini direttamente da Amazon Comprehend, senza dover prima estrarre il testo.

Molti clienti – sottolinea AWS – hanno bisogno di elaborare documenti in formato semi-strutturato, come immagini di ricevute scansionate o dichiarazioni fiscali in formato PDF.

Fino ad oggi, questi clienti dovevano prima pre-processare questi documenti per trasformarli in testo flat e machine-readable, cosa che poteva ridurre la qualità del contesto del documento. Solo successivamente, potevano usare Amazon Comprehend per classificare ed estrarre entità da tali file pre-elaborati.

Ora con Amazon Comprehend for IDP, i clienti possono elaborare i loro documenti semi-strutturati, come PDF, docx, PNG, JPG o immagini TIFF, nonché documenti di testo semplice, con un’unica chiamata API.

Questa nuova funzione combina l’OCR e le capacità di elaborazione del linguaggio naturale (NLP) di Amazon Comprehend per categorizzare ed estrarre entità dai documenti.

L’API di custom document classification consente di organizzare i documenti in categorie o classi, mentre l’API custom-named entity recognition permette di estrarre entità dai documenti, come codici di prodotto o entità specifiche per l’azienda.

Ad esempio, una compagnia di assicurazioni può ora elaborare le richieste di risarcimento dei clienti scansionate, con un minor numero di chiamate API. Utilizzando l’API di riconoscimento delle entità di Amazon Comprehend, può estrarre il numero del cliente dalle richieste di risarcimento e utilizzare l’API di classificazione personalizzata per classificare la richiesta di risarcimento nelle diverse categorie assicurative: casa, auto o persone.

Le API di Amazon Comprehend per IDP sono disponibili per l’inferenza in tempo reale dei file e per l’elaborazione batch asincrona di grandi set di documenti. Questa funzione semplifica la pipeline di elaborazione dei documenti e riduce il lavoro di sviluppo, sottolinea AWS.

È possibile saperne di più su Amazon Comprehend consultando la Developer Guide sul sito di AWS.