GenAI Extraction : la nouvelle génération d’extraction documentaire 

Avec GenAI, nous faisons évoluer en profondeur notre technologie d’extraction. L’accent se porte désormais sur ce qui compte réellement : obtenir un résultat final précis et structuré. 

Ce qui change 

Jusqu’à présent, l’extraction classique reposait sur une approche en plusieurs étapes. 
Les documents étaient d’abord segmentés en blocs OCR, ces blocs étaient ensuite classifiés, puis les résultats étaient assemblés en champs finaux à l’aide de règles supplémentaires. 

Cette approche fonctionnait globalement, mais présentait certaines limites : 

Forte dépendance aux structures de blocs : les variations de mise en page ou d’annotation peuvent affecter la qualité.  
Annotation fastidieuse : les données d’entraînement doivent être extrêmement cohérentes au niveau des blocs.  
Post-traitement complexe : la précision dépend souvent de règles supplémentaires et de configurations spécifiques.  
Exploitation limitée du feed-back : les corrections utilisateurs sont difficiles à intégrer directement comme données d’entraînement.  
Indicateurs imparfaits : la qualité de la classification des blocs ne reflète pas toujours celle du résultat final.

Point clé : 

Le système optimisait principalement des étapes intermédiaires et non le résultat final réellement attendu par l’utilisateur. 

Ce que GenAI Extraction change

Avec GenAI Extraction, un changement de paradigme s’opère.

Le modèle est directement entraîné à produire les champs finaux, c’est-à-dire les valeurs effectivement utilisées dans le système. Les étapes intermédiaires, comme la classification des blocs, perdent ainsi en importance.

Concrètement :

Le document est analysé dans son ensemble comme contexte.
Les définitions de champs et leurs descriptions (prompts) pilotent l’extraction.
Le modèle fournit directement les résultats finaux.

Au lieu d’annoter des fragments de texte isolés, le modèle interprète le document de manière globale pour en déduire les valeurs pertinentes.

La différence clé

La distinction fondamentale entre extraction classique et GenAI Extraction réside dans l’objectif d’optimisation :

• Extraction classique : optimise la classification d’éléments individuels (par ex. blocs OCR).

• GenAI Extraction : optimise directement la qualité du résultat final.

Cette approche rapproche l’extraction des cas d’usage réels tout en simplifiant considérablement le modèle technique.

Pourquoi c’est important 

GenAI Extraction introduit une nouvelle manière de travailler avec les modèles d’extraction. 

Au lieu de cycles d’entraînement rigides, on passe à un processus itératif : 

Définition des champs : noms clairs et prompts précis  
Obtention immédiate des résultats : extraction en zero-shot, sans entraînement  
Amélioration progressive : optimisation des prompts et résultats via le feed-back

Cela rend le développement plus rapide, plus transparent et plus évolutif, en particulier dans des environnements API et automatisés. 

Le focus se déplace clairement vers le résultat final, ce qui permet aux métriques et aux optimisations de mieux refléter la qualité en production. Le feed-back utilisateur peut en outre être intégré plus directement dans le processus d’apprentissage, favorisant une amélioration continue. 

Trois avantages clés montrent pourquoi l’extraction basée sur GenAI constitue un pilier essentiel de notre nouvelle approche. 

1. Zero-shot : extraction immédiate sans entraînement 

Le zero-shot transforme la manière de lancer un processus d’extraction. 

Il permet d’extraire des champs sans entraînement préalable. Le modèle s’appuie uniquement sur le nom du champ, sa description (prompt) et le contenu du document pour déterminer la valeur la plus probable. 

Avantages : 

Aucun processus d’entraînement classique requis  
Résultats disponibles immédiatement, sans annotation ni délai  
Import d’un document avec son fichier JSON associé  
Création d’un modèle directement depuis DocuWare

Le principal atout réside dans la rapidité du cycle de feed-back. Les champs peuvent être définis, testés et améliorés instantanément, avant même la création de données d’entraînement. 

Le zero-shot repose sur un raisonnement génératif. Le modèle interprète le contenu au lieu de simplement le classifier. La qualité des prompts devient donc déterminante. 

Cette approche est particulièrement efficace pour des champs standardisés et des types de documents courants. Pour des règles plus complexes, elle peut être complétée par du few-shot ou un entraînement dédié. 

2. Entraînement à partir de données existantes (par ex. documents DocuWare) 

Il n’est plus nécessaire de charger des documents et de les annoter manuellement. Les documents existants peuvent désormais servir directement à l’entraînement. 

Deux options sont possibles : 

Dans ce cas, il suffit de sélectionner les documents souhaités. Les valeurs d’index de l’armoire DocuWare servent alors d’annotations et de base d’entraînement. 
À qualité d’extraction équivalente, les modèles peuvent ainsi être créés et entraînés plus rapidement.

3. Entraînement basé sur la validation 

Autre avantage majeur : l’exploitation du feed-back issu de l’interface de validation pour améliorer les modèles existants. 

Cette fonctionnalité est actuellement en cours de développement et sera bientôt disponible. 

Lorsque les utilisateurs corrigent des valeurs extraites lors de la validation, ces corrections sont enregistrées et pourront alimenter les futurs cycles d’entraînement. 

Par ailleurs, la validation introduit un point de contrôle dans le workflow IDP automatisé : les résultats sont vérifiés avant d’être utilisés et le processus est suspendu jusqu’à validation. Seules les données validées sont ensuite transmises. 

Ce système de feed-back permet une amélioration continue. Grâce à des cycles de réentraînement réguliers, le modèle devient progressivement plus précis et fiable, un système adaptatif qui s’améliore avec l’usage. 

Des processus rigides à des systèmes apprenants 

GenAI Extraction marque le passage d’une approche pipeline classique à un système orienté résultats, capable d’évoluer en continu. 

L’objectif n’est plus d’optimiser chaque étape individuelle, mais d’assurer la qualité du résultat structuré final. 

L’entraînement ne constitue plus une phase distincte, mais s’inscrit dans un processus d’apprentissage continu, alimenté par l’utilisation et la validation. Le système s’adapte en permanence aux données et aux besoins réels. 

Il en résulte une extraction plus simple, plus transparente et plus proche des processus métiers, avec pour objectif de faire évoluer les modèles vers des systèmes productifs et adaptatifs, capables de s’améliorer en continu e.

GenAI Extraction : la nouvelle génération d’extraction documentaire

Ce qui change

Point clé :

Ce que GenAI Extraction change

Concrètement :

La différence clé

Pourquoi c’est important

1. Zero-shot : extraction immédiate sans entraînement

Avantages :

2. Entraînement à partir de données existantes (par ex. documents DocuWare)

Deux options sont possibles :

3. Entraînement basé sur la validation

Des processus rigides à des systèmes apprenants

De

Julia Schließmeier

Les sujets

Articles récents

Explorez DocuWare

Ressources partenaires

Information légale

Contactez-nous

GenAI Extraction : la nouvelle génération d’extraction documentaire

Ce qui change

Point clé :

Ce que GenAI Extraction change

Concrètement :

La différence clé

Pourquoi c’est important

1. Zero-shot : extraction immédiate sans entraînement

Avantages :

2. Entraînement à partir de données existantes (par ex. documents DocuWare)

Deux options sont possibles :

3. Entraînement basé sur la validation

Des processus rigides à des systèmes apprenants

De

Julia Schließmeier

Les sujets

Articles récents

Explorez DocuWare

Ressources partenaires

Information légale

Contactez-nous

GenAI Extraction : la nouvelle génération d’extraction documentaire 

Ce qui change 

Point clé : 

Pourquoi c’est important 

1. Zero-shot : extraction immédiate sans entraînement 

Avantages : 

2. Entraînement à partir de données existantes (par ex. documents DocuWare) 

Deux options sont possibles : 

3. Entraînement basé sur la validation 

Des processus rigides à des systèmes apprenants