Reconnaissance optique de caractères

Un document issu d'un scanner est d'abord une image. L'étape d'océrisation (OCR) permet d'en indexer le contenu et d'optimiser la taille.

Indexation et recherche plein text

Un document océrisé permet une indexation et une recherche dans son contenu. Un document optimisé permet une diffusion rapide (gain de taille).

Optimisations multiples

Gain de temps, gain de place et pertinence accrue : le traitement de reconnaissance optique de caractères peut être effectué en direct lors de la numérisation ou en tâche de fond au niveau du serveur. La priorité peut être donnée à la qualité ou à la compression. Le fichier pdf produit peut être composite (juxtaposition de zones de texte et d'images) ou multicouche (superposition des trois couches pour une meilleure fidélité à l'original). Le bon réglage d'une chaîne de traitement est indispensable pour atteindre ses objectifs.

Optical character recognition

 

Optical character recognition indexes the content of a scanned document and optimizes its size.

OCRIndexation and full-text search

Thanks to OCR, the content of a document can be indexed and searched in. The size of your document is reduced so it can be quickly diffused.

Kentika for saving space and time

Optical character recognition can be done directly from the client computer, or from the server via a robot like ABBYY Recognition Server. The PDF file can be a mix of text and pictures or a multi-layer file. You can decide to give priority to quality or compression.

Pour une information personnalisée