<img height="1" width="1" style="display:none;" alt="" src="https://px.ads.linkedin.com/collect/?pid=7444762&amp;fmt=gif">
Solutions
Produits
Ressources
À propos
Partenaires
Démo gratuite

Prise en charge avancée des formulaires : OCR optimisée, détection des cases à cocher et champs à remplir pour un traitement plus précis

Avec la nouvelle prise en charge avancée des formulaires, DocuWare IDP fait franchir un cap au traitement automatisé des formulaires. Le modèle OCR optimisé permet désormais, pour la première fois, d’extraire directement les valeurs des cases à cocher les plus courantes, sans contournements ni configurations complexes des modèles.

Cette fonctionnalité permet de capturer de manière structurée et fiable les cases à cocher dans les formulaires, qu’il s’agisse d’accords simples, d’options mutuellement exclusives ou de sélections multiples. Elle est complétée par une amélioration de la reconnaissance OCR pour les formulaires remplissables comportant des champs segmentés (un caractère par case), fréquents dans les documents administratifs et officiels.

 

Défis liés au traitement des formulaires

Les formulaires figurent parmi les types de documents les plus utilisés en entreprise, des déclarations de consentement et demandes diverses aux formulaires administratifs. Ils comptent également parmi les plus complexes à automatiser :

  • Les cases à cocher existent sous de nombreuses variantes

  • Les options peuvent être simples, exclusives ou multiples

  • Les mises en page varient selon la version, la source ou la langue

  • Les saisies textuelles sont souvent réparties sur des champs distincts

  • Les reprises manuelles sont chronophages et sources d’erreurs

Les approches OCR traditionnelles atteignent rapidement leurs limites dans ce contexte. Les cases à cocher devaient souvent être interprétées indirectement ou modélisées via des solutions de contournement complexes, avec un effort important et une fiabilité limitée. La prise en charge avancée des formulaires vient combler cette lacune.

Intégration fluide : comment la prise en charge avancée des formulaires soutient vos applications IDP

Les nouvelles fonctionnalités offrent des résultats optimaux lorsqu’elles sont utilisées avec des extractions personnalisées basées sur la version actuelle de l’OCR. Cela concerne toutes les extractions individuelles créées après le 19 décembre 2025. Pour les workflows Custom IDP plus anciens, la version OCR peut être mise à jour manuellement par les Services professionnels.

Au cœur de cette évolution figurent trois nouveaux types de champs « case à cocher », définissables directement dans les modèles d’extraction :

 

1.  Case à cocher unique

  • Capture une décision simple de type oui/non, par exemple un consentement ou une confirmation
  • Valeurs : activée / non activée

2. Cases multiples – sélection unique

  • Capture une seule option parmi plusieurs (similaire à des boutons radio)

  • Exemple : carte bancaire ou PayPal

3. Cases multiples – sélection multiple

  • Capture plusieurs sélections simultanées dans une liste d’options

  • Exemple : e-mail et/ou téléphone

L’annotation a été conçue pour être simple et uniforme : seule la case à cocher elle-même est annotée, qu’elle soit cochée ou non. Des validations intelligentes garantissent la définition correcte des champs à sélection multiple. Des indications visuelles dans l’interface d’annotation signalent les groupes de cases incomplets et réduisent les erreurs lors de l’entraînement des modèles.

Les résultats sont disponibles à la fois dans l’interface utilisateur et via l’API. Selon le type de champ, ils sont structurés sous forme de Boolean (activée/non activée), Enum (sélection unique) ou liste d’Enum (sélection multiple). Chaque case est ainsi représentée de manière claire sur le plan métier et univoque sur le plan technique.

Avantages clés

  • Extraction fiable des cases à cocher : prise en charge directe des principaux formats de cases

  • Complexité réduite des modèles : plus besoin de solutions de contournement pour les scénarios courants

  • Qualité des données améliorée : validations et retours d’annotation réduisent les erreurs

  • Optimisation pour les formulaires : OCR améliorée pour les champs segmentés et structurés

Un traitement automatisé des formulaires d’une grande précision

Les entreprises traitant régulièrement des documents basés sur des formulaires bénéficient particulièrement de cette évolution. Cas d’usage typiques :

  • Déclarations de consentement et de conformité
    (protection des données, newsletters, partage d’informations)
  • Sélections simples et multiples
    (modes de paiement, préférences de contact, centres d’intérêt, langues, allergies)
  • Formulaires administratifs et officiels
    avec cases à cocher et champs segmentés (un caractère par case), par exemple demandes, inscriptions ou pièces d’identité 

Sont pris en charge aussi bien les formulaires à mise en page fixe que ceuxprésentant la même structure de contenu avec une disposition variable. Même les formulaires remplissables avec saisiecaractère par caractère sont traités de manière nettement plus fiable grâce àla logique OCR améliorée.

Résultat :moins de corrections manuelles, des données structurées de manière cohérente etdes temps de traitement sensiblement réduits, même dans des environnementsdocumentaires complexes.

Transparence : limites actuelles et perspectives

Comme toute technologie basée sur l’OCR, certaines limites subsistent actuellement, notamment pour les cases à cocher sans cadre clairement défini ou pour les saisies textuelles fortement segmentées. Pour y remédier, une logique d’agrégation et de normalisation a déjà été mise en œuvre afin de regrouper et d’harmoniser les caractères reconnus.

Ces aspects font l’objet d’améliorations continues et seront encore optimisés dans les prochaines versions de l’OCR, avec pour objectif d’augmenter progressivement le taux d’automatisation.

Repenser les formulaires avec DocuWare IDP

Grâce à la prise en charge avancée des formulaires, DocuWare IDP améliore significativement leur traitement automatisé. L’association d’une OCR optimisée, d’une prise en charge directe des cases à cocher et de sorties structurées permet une automatisation plus fiable des modèles de formulaires courants.

Les entreprises réduisent leurs efforts manuels, améliorent la qualité de leurs données et posent les bases de processus entièrement numériques et pilotés par des règles, de la réception des documents jusqu’à l’application métier.

Découvrez comment DocuWare IDP peut transformer vos scénarios IDP basés sur des formulaires et démarrez dès maintenant l’automatisation intelligente !

Les sujets

Montrer tout

Articles récents