Retour à toutes les compétences
🔤
Documents

OCR avancé

OCR pour manuscrit, tableaux complexes et documents multi-colonnes.

4.7note
3 800 installations
ocr-and-documents + handwriting-engine + table-parser
Max requis

À propos de cette compétence

L'OCR standard échoue sur les notes manuscrites, les cellules fusionnées, les mises en page multi-colonnes et les documents d'archives. OCR avancé chaîne des modèles spécialisés pour chaque cas et réconcilie la sortie, avec un score de confiance par région pour savoir où relire. Utilisé pour les archives de recherche, les notes cliniques, les reçus, et tout ce qui était lisible sur papier mais se numérise mal.

Ce qu'elle fait

  • Reconnaissance de l'écriture manuscrite (cursive et imprimée)
  • Parsing de tableaux complexes avec cellules fusionnées
  • Prise en charge multi-colonnes et mises en page historiques
  • Scores de confiance par région
  • Post-traitement avec dictionnaires métier

Cas d'usage

  • Numériser des notes de recherche ou des dossiers cliniques manuscrits
  • Parser un PDF de tableau financier avec cellules fusionnées
  • Océriser un document d'archive multi-colonnes en markdown propre