Lettori fissi

martedì 18 maggio 2010

Quando conviene l'OCR?

L'OCR è un processo automatico che permette l'acquisizione automatica dei dati contenuti in un form, evitando agli operatori la digitazione manuale.
In linea di massima sembra che l'OCR sia conveniente, ma naturalmente non è sempre così e i benefici devono essere misurati.
Per i documenti scritti con caratteri machine print (stampe di computer) i livelli di riconoscimento dell'OCR sono solitamente alti e qui il processo è quasi sempre molto conveniente. Questo sia che si tratti di OCR zonale che di OCR di documenti semi strutturati (vedi fatture passive).
L'interrogativo si pone sui sistemi hand written (scritto a mano) dove per la difficolta dei motori di ICR le percentuali di riconoscimento scendono.
Per gli assegni i motori attuali di ICR garantiscono percentuali accettabili nell'adozione di queste tecnologie.
Per documenti dove la scrittura avviene in precise caselle (un esempio può essere quello delle ricette mediche), si hanno anche percentuali buone che giustificano l'adozione di un motore di ICR.
In altri casi garantire rate elevati anche con le più recenti tecnologie è impossibile (documenti non strutturati) ed infatti ci sono tanti centri servizi (Service Bureau) che non hanno adottato ancora nessun sistema di OCR/ICR e preferiscono impiegare persone che trascrivano i documenti acquisiti.
Quindi prima di adottare un sistema di questo genere è bene mettere in piedi un banco di prova per misurare i vantaggi di un sistema di OCR/ICR.

Micr Ocr

MICR sta per Magnetic Ink Character Recognition.
I caratteri sono stampati con l'ausilio di un inchiostro magnetico con all'interno ossido ferrico.
Durante il processo di lettura il lettore di Micr magnetizza l'inchiostro e poi la testina elettromagnetica provvede alla lettura dei caratteri codificati.
Il Micr è molto diffuso negli assegni infatti la sequenza numerica in basso è solitamente stampata con questa tecnologia.
L' alfabeto di questa codifica contiene 14 caratteri secondo lo standard (ISO 2033 / DIN 66226).

Oggi la lettura di questi codici può essere fatta anche in maniera ottica in maniera analoga all'ocr di caratteri.
Uno dei font per il Micr è il CMC7 che fu sviluppato in Francia negli anni 50 per l'elaborazione automatica degli assegni.

Il tasso d'errore per la lettura magnetica dei numeri presenti nella parte inferiore dell'assegno è inferiore è molto bassa e nel caso di caratteri MICR si arriva a tassi di errori inferiori all' 1% mentre il tasso di falso positivo (scambio dei caratteri) dei caratteri è dell'ordine di 1 ogni 100.000.

sabato 6 marzo 2010

Scanner Fujitsu e Moss

Fujitsu è da sempre uno dei riferimenti per quanto riguarda gli scanner documentali.
I suoi scanner sono tra i migliori in termini di qualità e prestazioni e hanno la particolarità di integrarsi con Microsoft Sharepoint (MOSS).
Il modulo di integrazione è denominato "KnowledgeLake Connect" dall'omonima KnowledgeLake, Inc azienda america leader nel mondo di integrazioni in ambito Microsoft Moss.
Se cercate quindi una soluzione per la digitalizzazione e l'archiviazione di documenti MOSS+Scanner Fujitsu può essere una ottima scelta.

lunedì 26 gennaio 2009

BARCODE RECOGNITION SU TELEFONINO

BARCODE RECOGNITION SU TELEFONINO

HTC G1 Android porta su dispositivi mobile il riconoscimento ottico di barcode.

Infatti la fotocamera da 3 Megapixel e l'applicazione per la lettura di Barcodepermettono di rilevare i codici a barre. Negli USA questo ha dato spunto alla realizzazione di innovative applicazioni per poter ad esempio immediatamente effettuare un confronto dei prezzi e leggere recensioni su quei prodotti.

lunedì 1 dicembre 2008

Kofax VRS - Cosa è?

Kofax VRS è uno strumento per l'ottimizzazione delle immagini acquisite con scanner.
Vi sono versioni software e versioni che si basano su schede hardware.

Si basa sul protocollo di comunicazione ISIS ( Captiva Software) ma anche la possibilità di utilizzare wrapper che consentono la comunicazione TWAIN. Compatibilità con le specifiche Twain 1.9.

domenica 16 novembre 2008

Tesseract OCR - Free OCR - Open Source project

Tesseract OCR è un progetto, che nasce all'Università del Nevada e ha il patriocinio di HP (1985).

In geometria il "tessaract" è l'analogo del cubo a quattro dimensioni.

Sistemi operativi supportati:

* Ubuntu 6.06 (x86/32, x86/64)
* Ubuntu 6.10 (x86/32, x86/64)
* Windows (x86/32)

Supporto per i linguaggi: English, French, Italian, German, Spanish, Dutch

Lo sviluppatore di riferimento del progetto è: Ray Smith (theraysmith).

Per le prossime release si sta pensando:

- l'integrazione con OCRopus, un tool per l'analisi del layout delle immagini;
- Un front ed / interfaccia da condividere con OCRopus;
- Il supporto a più linguaggi;
- supporto di immagini ad alta risoluzione per avere migliori risultati di riconoscimento ottico dei caratteri (OCR).

mercoledì 5 novembre 2008

BARCODE RECOGNITION FOR FREE

BARCODE RECOGNITION FOR FREE

Often it is required to just digitalize paper documents and extract the barcode inside...

In this case a data capture system can organize the workflow expecially if there are a lot of people involved in the process, sometimes there is a solution for free..

A lot of scanners embedd some barcode recognition feature so during the paper documents digitalization the can store in txt/csv files the information inside the barcode with the image path.

In other cases it is possible to store the barcode information as the image filename (with a progressive sequence at the end, we could have the same data into the barcode) .

So sometimes it is not required to buy a OCR/ Barcode recognition engine it is better to spend time to choose the right scanner.

Fujitsu, Canon, Kodak are between the best scanners brands.