Il problema Trasformare in formato digitale i documenti acquisiti da scanner La soluzione SimpleOCR: software che trasforma in testo modificabile i documenti acquisiti da scanner e i file grafici contenenti immagine
Aprile 2007 Il riconoscimento automatico dei caratteri OCR (Optical
Character Recognition) è utile per chi ha spesso necessità di
trasformare in testi editabili documenti cartacei acquisiti con lo scanner.
L’OCR è infatti il sistema di gran lunga più rapido per
ottenere un file testuale: in pochi secondi la pagina è già sul
PC in formato digitale, contro i diversi minuti necessari sia per la digitazione
da tastiera che per la dettatura con software di riconoscimento vocale.
L’accuratezza raggiunta dai moderni motori di riconoscimento OCR, superiore
al 99%, consente di non perdere troppo tempo a correggere gli errori, mentre
con i software di riconoscimento vocale gli errori sono ancora molti.
Chi non ha avuto la fortuna di trovare un software OCR già incluso
con il proprio scanner deve però spendere cifre da 50 ai 500 euro per
dotarsi di un software OCR commerciale. SimpleOCR è invece tra i pochissimi
OCR gratuiti ed è composto da due moduli. Il primo è il motore
OCR, che effettua il riconoscimento caratteri da testi stampati. Il secondo
è invece dedicato al riconoscimento di testi manoscritti, funzione molto
più avanzata chiamata ICR (Intelligent Character Recognition), assente
anche nella maggioranza degli OCR commerciali come OmniPage o FineReader, a
parte costose versioni professionali. Si chiama CharacTell SoftWriting ed è
offerto in prova gratuita per 14 giorni, dopodiché costa 59,95 dollari.
Il motore OCR invece continuerà a funzionare a tempo illimitato. Con
SimpleOCR è possibile riconoscere testi sia da immagini grafiche di pagine
in formati TIFF, BMP e JPEG, sia acquisendo le pagine da scanner. Supporta quasi
tutti gli scanner sul mercato, grazie alla compatibilità TWAIN. I dizionari
linguistici inclusi sono inglese, francese ed olandese, ma il dizionario italiano
per il modulo ICR è scaricabile gratuitamente dall’indirizzo del
produttore e con un piccolo trucco è utilizzabile anche con il modulo
OCR.
SimpleOCR è in grado di salvare i testi riconosciuti sia come documenti
Word che come file TXT. L’accuratezza di riconoscimento è buona,
mentre rispetto agli OCR commerciali manca la possibilità di mantenere
il layout originale della pagina o di salvarla in PDF.
Carta
d’identità |
|
Software: | SimpleOCR |
Categoria: | Lavoro |
Versione: | Completa |
Lingua: | Inglese |
Spazio su HD: |
25 MB |
S.O. | Win 9x, ME, NT, 2000, XP |
Difficoltà d’uso: | *** |