Une chaîne de traitement UIMA comporte trois types d'éléments :
- Le Collection Reader : généralement le premier élément de la chaîne, il permet de créer des CAS autour de chaque ressource.
- Les Analysis Engines : raison d'être de la chaîne, ils effectuent les traitements en utilisant les annotations contenues dans le CAS et en produisant de nouvelles annotations dans le CAS.
- Le Workflow Controller : c'est lui qui orchestre l'exécution des Analysis Engines.
On peut distinguer deux types de Workflow Controller :
- le CPM (Collection Processing Manager) et les service Vinci (Vinci Services) ;
- et le tout nouveau AS (Asynchronous Scaleout) bien plus flexible.
L'interface graphique Collection Processing Managment, instancie un Workflow Controller du type CPM appelé FixedFlow qui consiste simplement à enchaîner séquentiellement un Collection Reader, puis un certain nombre d'Analysis Engine et enfin un CAS Consumer. Un CAS Consumer n'étant rien d'autre qu'un Analysis Engine particulier qui n'est pas destiné à enrichir un CAS mais qui génère une sortie (généralement un fichier) à partir des annotations contenues dans le CAS.


0 commentaires:
Enregistrer un commentaire