OCR da Optical Character Recognition, ovvero riconoscimento automatico dei caratteri.
I motori di OCR si basano su sofisticati algoritmi sviluppati attorno i concetti di intelligenza artificiale e di pattern matching.
Le prime implementazioni si trovano nei sistemi degli uffici postali statunitensi, i quali furono tra i primi ad introdurre questi automatismi all'interno della loro organizzazione.
Il nome OCR e' utilizzato in maniera generica ma esistono altre denominazioni per specifici algoritmi di estrazione dei dati (OCR,ICR,BARCODE,OMR). Abbiamo così:
- OCR (Optical Character Recognition) : per i caratteri detti machine print o dattiloscritti;
Qui le tecnologie sono molto mature e si riescono a raggiungere valori di estrazione corretti del 99%.
- ICR (Intelligent character recognition) : per il riconoscimento di caratteri scritti a mano o parole in corsivo;
L'ICR sta migliorando i propri risultati, si arriva a valori anche dell'80% nel riconoscimento del MAIUSCOLO. Questo tipo di riconoscimento ha risultati solitamente non comparabili con l'OCR di testo dattiloscritto data la variabilita' delle grafie.
Si sta affermando anche una nuova branca del riconoscimento ICR, detta cursive recognition che permette il riconoscimento del corsivo (utilizzata nell' ICR di assegni, OCR assegni).
- Barcode Recognition 1D e 2D : per il riconoscimento di Barcode 1D e 2D (e.s. PDF 417).
Qui si ottengono valori del 100% con immagini di buona qualita'.
- OMR (Optical Mark Recognition) : Riconoscimento di "MARK", utilizzato per questionari, etc..
Risultati vicini al 100%.
Iscriviti a:
Commenti sul post (Atom)
Nessun commento:
Posta un commento