Lettori fissi

domenica 16 novembre 2008

Tesseract OCR - Free OCR - Open Source project

Tesseract OCR è un progetto, che nasce all'Università del Nevada e ha il patriocinio di HP (1985).

In geometria il "tessaract" è l'analogo del cubo a quattro dimensioni.

Sistemi operativi supportati:

* Ubuntu 6.06 (x86/32, x86/64)
* Ubuntu 6.10 (x86/32, x86/64)
* Windows (x86/32)

Supporto per i linguaggi: English, French, Italian, German, Spanish, Dutch

Lo sviluppatore di riferimento del progetto è: Ray Smith (theraysmith).

Per le prossime release si sta pensando:

- l'integrazione con OCRopus, un tool per l'analisi del layout delle immagini;
- Un front ed / interfaccia da condividere con OCRopus;
- Il supporto a più linguaggi;
- supporto di immagini ad alta risoluzione per avere migliori risultati di riconoscimento ottico dei caratteri (OCR).

Nessun commento: