Le logiciel de reconnaissance optique de caractères (OCR), également appelé capture de documents, est la technologie utilisée pour convertir la plupart des types d'images contenant du texte écrit en données textuelles lisibles par machine. Une fois que les documents numérisés subissent un traitement OCR, le texte peut être édité à l'aide de traitements de texte. Le logiciel OCR couvre un large éventail de cas d'utilisation en raison de sa fonctionnalité de base. Ces outils peuvent être utilisés par pratiquement n'importe quelle équipe au sein d'une organisation, en particulier les équipes de comptabilité, de ressources humaines et de saisie de données pour extraire des informations importantes de grandes quantités de fichiers papier et numériques. Le logiciel OCR peut considérablement réduire le temps passé à la saisie manuelle, minimiser les erreurs critiques et améliorer les efforts de détection de fraude. Certains outils de cette catégorie peuvent également rendre les documents consultables et bien organisés pour un accès ultérieur par les personnes nécessaires au sein de l'organisation.
Le logiciel OCR traditionnel a une fonctionnalité limitée mais fondamentalement puissante. Récemment, une version améliorée de la technologie OCR, appelée logiciel de traitement intelligent de documents (IDP), a évolué à partir des limitations de l'OCR. La catégorie OCR de G2 contient les deux types de produits : le logiciel OCR pur et le logiciel IDP. Le logiciel OCR pur a toutes les fonctionnalités et cas d'utilisation énumérés ci-dessus. Le logiciel IDP a également toutes les fonctionnalités du logiciel OCR, cependant, il utilise également des technologies avancées telles que le logiciel d'apprentissage automatique, le logiciel de traitement du langage naturel (NLP), et le logiciel de reconnaissance d'image pour numériser intelligemment les documents et s'améliorer continuellement en fonction des modèles et du comportement des utilisateurs. Ces produits diffèrent également du logiciel OCR pur car ils ne se préoccupent que de la simple numérisation d'un document, pas de l'analyse des informations qu'il contient. Comme le texte extrait à l'aide de cette technologie a un sens, ces données peuvent être utilisées pour des processus en aval. Ainsi, le logiciel IDP peut être intégré à diverses applications, systèmes et autres plateformes d'automatisation.
Le logiciel OCR est souvent considéré comme une technologie cachée car il est utilisé dans de nombreux autres produits logiciels dont le but principal est autre que le traitement de documents. De nombreuses options logicielles, comme le logiciel CRM, les systèmes ERP, le logiciel de comptabilité, et le logiciel de gestion de contenu d'entreprise (ECM) utilisent tous la technologie OCR pour accroître l'efficacité.
Pour être inclus dans la catégorie Reconnaissance Optique de Caractères (OCR), un produit doit :
Traiter des images numériques et/ou des numérisations de divers types de documents
Identifier et extraire les données pertinentes dans les documents numérisés et les convertir en texte lisible par machine qui peut être recherché et édité
Aider à la classification et au tri des fichiers de documents capturés