Convertire immagini in testi: FreeOCR

How-To Scrivi un commento

Capita a volte di dover convertire un’immagine contenente del testo (acquisita, ad esempio, tramite uno scanner) in un documento di testo liberamente modificabile con un normale programma di videoscrittura (OpenOffice, Word, etc…).

A questo scopo possiamo utilizzare programmi dedicati al riconoscimento ottico dei caratteri, conosciuti anche come sistemi di OCR (dall’inglese Optical Character Recognition).

In questo articolo descriveremo FreeOCR, programma di OCR completamente gratuito, che si può scaricare da questo sito.

Una volta fatto il download e completata l’installazione (che richiede una connessione Internet attiva), è necessario scaricare anche alcuni componenti aggiuntivi che permetteranno a FreeOCR di riconoscere la lingua italiana, visto che le impostazioni di default sono soltanto in lingua inglese.

Il file per la lingua italiana si trova a questo link. Dopo aver fatto il download, è necessario scompattare il file compresso usando un programma per la decompressione degli archivi (ad esempio, potete utilizzare l’ottimo 7zip che trovate a questo link).

Dovrete quindi copiare l’intero contenuto della cartella tessdata (tutti i file che iniziano per ita) all’interno della cartella C:\\Windows\tessdata.

Ultimate queste operazioni preliminari, sarete pronti a utilizzare FreeOCR. Lanciate il programma dal collegamento nel menù Start, e impostate la lingua italiana dall’apposito menù a tendina che trovate in alto a destra della schermata principale:

Cliccate sul pulsante Open e sfogliate le vostre cartelle fino a selezionare l’immagine contenente il testo che volete convertire:

Selezionate il testo da far riconoscere a FreeOCR cliccando prima sul pulsante “Fit image” della barra verticale degli strumenti, quindi cliccate sul pulsante OCR.

Una volta che il testo selezionato sarà digitalizzato e convertito, verrà reso disponibile nella sezione di destra della schermata del programma, da cui potrete copiarlo negli appunti o esportarlo direttamente in un documento Word agendo sugli appositi pulsanti.

FreeOCR è la versione gratuita già compilata e compatibile con Windows di Tesseract, programma OCR open source il cui sviluppo è passato da qualche tempo a Google.

Se questo articolo ti è piaciuto o ti è stato utile, iscriviti gratuitamente ai nostri feed RSS per restare sempre aggiornato sulle nuove pubblicazioni di Particelle Elementari!

 Iscriviti gratuitamente ai nostri feed RSS!

Se vuoi saperne di più sui feed RSS (cosa sono e a che servono) clicca qui.

Non dimenticare di segnalare l'articolo e condividerlo con i tuoi amici! Puoi anche lasciare una tua valutazione, con un voto da 1 (min) a 5 (max), o un commento.

Leggi anche:

Condividi e vota questo articolo

1 Stella2 Stelle3 Stelle4 Stelle5 Stelle (Dai un voto!)
Loading ... Loading ...

Scrivi un commento

 

Particelle Elementari è sviluppato su piattaforma WordPress
WP Theme & Icons by N.Design Studio Restyling by Tecnìco, Adapted by Particelle Elementari
Feed RSS Mappa Sito Collegati