Outils pour utilisateurs

Outils du site


public:annotation

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:annotation [2017/11/17 14:35]
slh@ens-lyon.fr
public:annotation [2021/04/15 10:27] (Version actuelle)
matthieu.decorde@ens-lyon.fr [Moteur d'annotation]
Ligne 17: Ligne 17:
 ===== Mises en oeuvre ===== ===== Mises en oeuvre =====
  
 +==== Moteur d'​annotation ====
 +
 +Les outils d'​annotation sont ajoutés à TXM via le mécanisme des moteurs de TXM, en utilisant le type de moteur '​ANNOTATION'​. Ce mécanisme est utilisé pour les outils d'​annotation automatique (eg TreeTagger) et pour les outils d'​annotation interactifs (eg annotation de propriétés de mots par concordances).
 +
 +La classe org.txm.annotation.core.AnnotationEnginesManager charge tous les org.txm.annotation.core.AnnotationEngine implémentés dans les différents plugins TXM pour l'​annotation (ex: org.txm.treetagger.core).
 +
 +Pour être fonctionnel,​ un AnnotationEngine doit implémenter les méthodes suivantes :
 +  * getName() : nom de l'​outil -> utilisé par le module d'​import pour permettre à l'​utilisateur de choisir un moteur d'​annotation automatique
 +  * isAutomatic() : indique si le moteur peut annoter automatiquement lors de l'​import
 +    * getStringTokenizer() : si le moteur a besoin d'une tokenization particulière pour travailler, il doit proposer un tokenizer de chaine pour
 +  * hasAnnotationsToSave() : indique s'il y a des annotations à sauvegarder avant de fermer TXM ou un onglet de résultats
 +  * processFile(xmlFile,​ corpusDirectory,​ parameters) : traite un fichier dans le cas d'un moteur automatique
 +    * parameters: transfert les paramètres à donner aux moteurs. Il y a pour l'​instant 2 paramètres possibles :
 +      * lang : la langue du corpus -> doit permettre au moteur de trouver le modèle adapté
 +      * langs : une HashMap qui associe un fichier xml à traiter avec une langue
 +
 +Lors de l'​import,​ la méthode AnnotationEngine.processDirectory() du moteur sélectionné est appelée pour travailler sur le répertoire "​CORPUS/​txm"​ des fichiers XML-TXM.
 +
 +Si un moteur d'​annotation peut être utilisé dans une interface de TXM (annotation interactive) il doit implémenter le point d'​extension AnnotationArea. Cela lui permettra d'​être inclus dans la liste des outils d'​annotation disponibles du bouton "​Annoter"​ de la toolbar des éditeurs de résultats.
 ==== Automatique : TAL ==== ==== Automatique : TAL ====
  
 +  * [[public:​specs_annotation_nlp_api|Spécification de l'​annotation linguistique automatique]]
   * [[specs_import_annotation_lexicale_auto|Spécification de l'​annotation lexicale automatique]] :   * [[specs_import_annotation_lexicale_auto|Spécification de l'​annotation lexicale automatique]] :
-    * Grille des outils et de leurs architectures +    * [[public:​annotation:​tal_treetagger|TreeTagger]] 
-    *  ​ +    * [[public:​annotation:​tal_udpipe|UDPipe]]
-    * [[stanford_segmenter_and_tagger|Segmenteur et du Tagger de Stanford]]+
     * [[tal_talismane|Talismane]]     * [[tal_talismane|Talismane]]
 +    * [[stanford_segmenter_and_tagger|Segmenteur et Tagger de Stanford]]
     * [[tal_Melt|Melt]]     * [[tal_Melt|Melt]]
-    * ... +  ​* [[specs_correction_tokenisation|Spécification de la re-segmentation et de la ré-annotation ​de mots]]
-  * Segmentation des mots, phrases, etc. +
-  ​* [[specs_correction_tokenisation|Spécification de la re-segmentation et de la ré-annotation ​des mots]]+
   * [[specs_import_annotation_syntaxique_auto|Spécification de l'​annotation syntaxique automatique]]   * [[specs_import_annotation_syntaxique_auto|Spécification de l'​annotation syntaxique automatique]]
-  ​...+    ​[[specs_import_annotations|Spécification de l'​import d'​annotations syntaxiques]] 
 +  * [[public:​specs_annotation_entites_nommees_auto|Spécification de l'​annotation en entités nommées automatique]]
  
 ==== Assistée ==== ==== Assistée ====
  
-  * [[public:​annotation:​specs_manual_annotation|page d'​annotation ​assistée]]+  * [[public:​annotation:​specs_manual_annotation|Annotation ​assistée]]
     * [[public:​annotation:​specs_annotation_analec|Spécification de l'​annotation Analec dans TXM]]     * [[public:​annotation:​specs_annotation_analec|Spécification de l'​annotation Analec dans TXM]]
  
Ligne 39: Ligne 58:
  
   * [[public:​spec_exploitation_annotation|Exploitation d'​annotation dans TXM]]   * [[public:​spec_exploitation_annotation|Exploitation d'​annotation dans TXM]]
-  * [[public:​annotation:​specs_referentiel_annotation|des référentiels ​d'​annotation]]+  * [[public:​annotation:​specs_referentiel_annotation|Référentiels ​d'​annotation]]
   * [[.:​annotation:​specs_export_xml|Spécification des différents exports XML]]   * [[.:​annotation:​specs_export_xml|Spécification des différents exports XML]]
  
public/annotation.1510925708.txt.gz · Dernière modification: 2017/11/17 14:35 par slh@ens-lyon.fr