SimpleOCR – Acquisire testi da scanner con riconoscimento dei caratteri

Il problema Trasformare in formato digitale i documenti acquisiti da scanner La soluzione SimpleOCR: software che trasforma in testo modificabile i documenti acquisiti da scanner e i file grafici contenenti immagine

Aprile 2007 Il riconoscimento automatico dei caratteri OCR (Optical
Character Recognition) è utile per chi ha spesso necessità di
trasformare in testi editabili documenti cartacei acquisiti con lo scanner.
L’OCR è infatti il sistema di gran lunga più rapido per
ottenere un file testuale: in pochi secondi la pagina è già sul
PC in formato digitale, contro i diversi minuti necessari sia per la digitazione
da tastiera che per la dettatura con soft­ware di riconoscimento vocale.
L’accuratezza raggiunta dai moderni motori di riconoscimento OCR, superiore
al 99%, consente di non perdere troppo tempo a correggere gli errori, mentre
con i software di riconoscimento vocale gli errori sono ancora molti.

Chi non ha avuto la fortuna di trovare un soft­ware OCR già incluso
con il proprio scanner deve però spendere cifre da 50 ai 500 euro per
dotarsi di un software OCR commerciale. SimpleOCR è invece tra i pochissimi
OCR gratuiti ed è composto da due moduli. Il primo è il motore
OCR, che effettua il riconoscimento caratteri da testi stampati. Il secondo
è invece dedicato al riconoscimento di testi manoscritti, funzione molto
più avanzata chiamata ICR (Intelligent Character Recognition), assente
anche nella maggioranza degli OCR commerciali come OmniPage o FineReader, a
parte costose versioni professionali. Si chiama CharacTell SoftWriting ed è
offerto in prova gratuita per 14 giorni, dopodiché costa 59,95 dollari.

Il motore OCR invece continuerà a funzionare a tempo illimitato. Con
SimpleOCR è possibile riconoscere testi sia da immagini grafiche di pagine
in formati TIFF, BMP e JPEG, sia acquisendo le pagine da scanner. Supporta quasi
tutti gli scanner sul mercato, grazie alla compatibilità TWAIN. I dizionari
linguistici inclusi sono inglese, francese ed olandese, ma il dizionario italiano
per il modulo ICR è scaricabile gratuitamente dall’indirizzo del
produttore e con un piccolo trucco è utilizzabile anche con il modulo
OCR.

SimpleOCR è in grado di salvare i testi riconosciuti sia come documenti
Word che come file TXT. L’accuratezza di riconoscimento è buona,
mentre rispetto agli OCR commerciali manca la possibilità di mantenere
il layout originale della pagina o di salvarla in PDF.

Carta
d’identità
Software: SimpleOCR
Categoria: Lavoro
Versione: Completa
Lingua: Inglese
Spazio su
HD:
25 MB
S.O. Win 9x, ME, NT, 2000, XP
Difficoltà d’uso: ***

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome