Il problema Acquisire il testo presente in un’immagine per riutilizzarlo in documenti di gestione testi La soluzione TopOCR riconosce testo da file JPG, GIF, TIFF o BMP, permette correzioni generando file di testo e MP3
Gennaio 2009 Salvo specifici casi di attività professionale
in ambito editoriale, non è frequente trovare persone che utilizzano
ogni giorno un programma di OCR (Optical Character Recognition). Nel momento
in cui diventa necessario recuperare testo da un’immagine per incollarlo
in altri documenti, però, è importante averne uno che sia agevole
da utilizzare ed efficiente nelle funzionalità.
Perché un OCR sia valido, il primo requisito da possedere è l’efficacia
del riconoscimento. In mancanza, si rischia di impiegare tempo in operazioni
che conducono a un esito finale insoddisfacente. Proprio per questo, chi ne
ha bisogno di solito acquista uno dei programmi più noti, in commercio
da anni, spesso con un costo di acquisto non propriamente basso.
TopOCR, invece, è freeware. Ciò nonostante, svolge il suo compito
con semplicità e buoni risultati. Tra l’altro, oltre al puro riconoscimento
del testo, integra un certo numero di strumenti aggiuntivi. Utilizzandoli, si
migliora la qualità del lavoro e si ottiene una più comoda fruizione
dei risultati.
Tra essi ci sono la lettura del testo attraverso gli altoparlanti, la generazione
di file audio MP3 e l’acquisizione di immagini da cellulari e da altre
periferiche.
Il modulo OCR
Nella fase di lettura, TopOCR riconosce testo appartenente a undici lingue,
tra cui l’italiano e quelle occidentali più diffuse: inglese, francese,
spagnolo e tedesco. Non gestisce lingue come arabo, cinese e giapponese.
Lanciandolo in esecuzione, si aprono due finestre affiancate che rimangono agganciate
tra loro anche quando se ne sposta una sul Desktop. In quella di sinistra avviene
il riconoscimento dei caratteri. Quella di destra, TopOCR Text, corrisponde
a un vero e proprio programma di gestione testi.
Quando si apre il file di un’immagine, il programma ne visualizza il
contenuto nella finestra di sinistra e lancia immediatamente il motore di riconoscimento
del testo. Il risultato dell’elaborazione viene visualizzato sulla destra,
dove può essere corretto e modificato a piacere.
Per evitare di sottoporre l’intera immagine al motore di conversione da
immagine a testo, se ne può delimitare un’area rettangolare con
il mouse. Successivamente la si copia e la si incolla nella finestra di sinistra,
in modo da lanciare il riconoscimento del testo solo nella zona che interessa.
Secondo il produttore, la qualità del riconoscimento può raggiungere
la percentuale del 99,8%, a patto di avere un’immagine di partenza di
buona qualità. Un modo per migliorare la percentuale è ingrandire
il testo con un fattore di zoom 2x o 4x. Nel programma, l’intervento può
essere eseguito con uno dei comandi del menu Image ed essere ripetuto
più volte. Oltre che in formato testo TXT, in uscita il programma genera
file nei formati RTF, PDF e HTML.
TopOCR integra anche la funzione di acquisizione diretta di immagini da scanner,
da webcam o da altri dispositivi di cattura immagini, purché abbiano
interfaccia standard TWAIN.
Funzioni di TopOCR Text
Le funzionalità sono del tutto analoghe a quelle di un programma di gestione
testi. Si possono formattare caratteri e paragrafi e gestire elenchi puntati
e numerati. In ogni pagina si possono inserire immagini, semplici tabelle e
interruzioni di pagina. Inoltre, si possono gestire intestazione e pie’
di pagina e inserire campi il cui valore viene generato automaticamente, come
la data di sistema o il numero della pagina corrente.
Una funzione utile è TextToSpeech. Attivandola, il testo viene riprodotto
ad alta voce per ascoltarlo attraverso gli altoparlanti o le cuffie. La voce
predefinita in Windows, però, ha inflessione in inglese (Microsoft SAM).
Per ascoltare il testo con dizione in italiano, occorre installare il relativo
motore di riproduzione audio. Uno prelevabile liberamente è disponibile
a questo indirizzo Internet.
Un’altra interessante funzione di TopOCR Text permette di registrare
la lettura audio del testo in un file. Si può generare un file WAV e,
da esso, un MP3 da ascoltare quando e dove lo si desidera, magari con un cellulare
o con un riproduttore tipo iPod.
Ne consegue una comodità da non trascurare per chi viaggia di frequente
o si sposta in tragitti di una certa durata da un posto a un altro.
Aperto al mondo del lavoro
TopOCR è stato sviluppato anche per recuperare testi da immagini catturate
con fotocamere digitali o da cellulari, purché i dispositivi abbiano
un obiettivo di almeno 3 Megapixel e l’illuminazione del supporto di partenza
sia corretta. Nel caso contrario la qualità dell’immagine potrebbe
non essere sufficiente per garantire un corretto riconoscimento. In ambito lavorativo
la caratteristica può essere sfruttata per acquisire le scritte stampate
sui biglietti da visita e ridurre il tempo necessario per inserirle nella propria
rubrica informatizzata.
Un altro impiego potrebbe essere l’acquisizione di testi da documenti
cartacei ricevuti in una riunione di lavoro o consegnati da interlocutori istituzionali,
per inviarli telematicamente al proprio ufficio in tempo reale.
Anche per questo, del programma esiste una versione installabile in un palmare/smartphone
con Windows Mobile 6.0 e interfaccia Web. Con questa configurazione, si può
acquisire un testo al volo per inviarlo come allegato in posta elettronica o
direttamente a un server Web in Internet.
Nella pagina Web http://www.topocr.com/mtutorial.html
sono pubblicati diversi consigli su cosa fare per avere una buona immagine da
convertire in testo.
Dalla stessa pagina si può prelevare un file PDF con una pagina campione
da utilizzare per la calibrazione delle periferiche di cattura delle immagini.
|
Carta
d’identità |
|
| Software: | TopOCR |
| Categoria: | Lavoro |
| Versione: | Freeware |
| Lingua: | Inglese |
| Richiede installazione : |
Sì |
| S.O. | Windows XP e precedenti |





