E’ possibile il riconoscimento vocale di file in MP3?

Sto valutando l’acquisto di un programma di riconoscimento vocale come Dragon Naturally Speaking Preferred e ho visto che vi è la possibilità di registrare file audio e successivamente di lavorarli col Dragon. Non ho capito però un …

Sto valutando l’acquisto di un programma di riconoscimento vocale come Dragon Naturally Speaking Preferred e ho visto che vi è la possibilità di registrare file audio e successivamente di lavorarli col Dragon. Non ho capito però una cosa: io ho varie vecchie registrazioni in WAV, WMA ed MP3 di lezioni e conferenze, registrate tramite un vecchio lettore MP3, conferenze che dovrei sbobinare e trascrivere: è possibile lavorarle con Dragon? Il programma funziona anche con la voce di più persone?

Dragon Naturally Speaking è in grado di riconoscere il parlato di una voce umana e trascriverlo sotto forma di testo in un documento, che può essere salvato in formato TXT, in formato DOC di Word o in RTF. La precisione di riconoscimento è aumentata molto negli ultimi anni, anche se è ancora lontana da quanto possibile acquisendo un documento stampato tramite scanner.

Quando però non esiste un documento stampato, ad esempio per l’audio di una conferenza o un’intervista, allora Dragon può essere molto utile per avere una trascrizione scritta di quanto detto a voce. Il software può funzionare in diretta o in differita.

Per l’uso in diretta si deve collegare al PC la cuffia/microfono inclusa nella confezione di Dragon e parlare, il software riconoscerà quanto detto e lo trascriverà, inoltre potrà riconoscere anche i comandi impartiti a voce per usare Windows e le applicazioni del PC, e per questo Dragon è utile anche per i diversamente abili in quanto consente di usare il PC tramite comandi vocali invece che con mouse e tastiera.

Per l’uso in differita invece si usa un registratore vocale digitale che registra il testo dettato, e poi si scarica il file audio dal registratore al computer dove Dragon provvederà a riconoscerlo e trascriverlo come file di testo.

Il riconoscimento in differita funziona con diversi modelli di registratore consigliati da Dragon sul suo sito, ma il riconoscimento funziona con file audio realizzati da qualsiasi registratore, pur se con risultati diversi. Ci sono infatti registratori che per qualità e pulizia del suono danno risultati migliori rispetto ad altri.

Dunque nel caso proposto dal lettore, Dragon potrà certamente riconoscere le registrazioni di conferenze e lezioni, qualsiasi sia il registratore con cui esse sono state registrate, però i risultati a livello di precisione di parole riconosciute varieranno in base alla qualità della registrazione stessa.

Certamente un vecchio lettore MP3 non avrà registrato con la qualità possibile tramite un moderno registratore vocale specializzato, ma la qualità potrebbe essere comunque sufficiente per ottenere una buona percentuale di riconoscimento in fase di trascrizione.

Per quanto riguarda la possibilità di riconoscere voci di persone diverse, anche in questo caso va detto che Dragon è in grado di riconoscere la voce di qualsiasi persona, ma la precisione di riconoscimento migliora se Dragon viene “allenato” tramite un’apposita sezione del software in cui l’utente legge frasi proposte da Dragon, in quanto in questo modo Dragon impara ad “adattarsi” allo stile, alla pronuncia e al timbro di voce dell’utente.

Dunque Dragon otterrà risultati migliori se a parlare è l’utente che ha effettuato la fase di training con il software stesso, ma sarà comunque in grado di riconoscere anche la voce di chi parlava nelle conferenze o lezioni che il nostro lettore vuole riversare, pur se con precisione di riconoscimento inferiore.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome