Outils pour utilisateurs

Outils du site


public:annotation

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
public:annotation [2019/08/23 10:20]
matthieu.decorde@ens-lyon.fr [Automatique : TAL]
public:annotation [2021/03/26 11:08]
slh@ens-lyon.fr [Moteur d'annotation]
Ligne 17: Ligne 17:
 ===== Mises en oeuvre ===== ===== Mises en oeuvre =====
  
 +==== Moteur d'​annotation ====
 +
 +Les outils d'​annotation sont ajoutés à TXM via le mécanisme des moteurs de TXM, en utilisant le type de moteur '​ANNOTATION'​. Ce mécanisme est utilisé pour les outils d'​annotation automatique (eg TreeTagger) et pour les outils d'​annotation interactifs (eg annotation de propriétés de mots par concordances).
 +
 +La classe org.txm.annotation.core.AnnotationEnginesManager charge tous les org.txm.annotation.core.AnnotationEngine implémentés dans les différents plugins TXM pour l'​annotation (ex: org.txm.treetagger.core).
 +
 +Pour être fonctionnel,​ un AnnotationEngine doit implémenter les méthodes suivantes :
 +  * getName() : nom de l'​outil -> utilisé par le module d'​import pour permettre à l'​utilisateur de choisir un moteur d'​annotation automatique
 +  * isAutomatic() : indique si le moteur peut annoter automatiquement lors de l'​import
 +  * hasAnnotationsToSave() : indique s'il y a des annotations à sauvegarder avant de fermer TXM ou un onglet de résultats
 +  * processFile(xmlFile,​ corpusDirectory,​ parameters) : traite un fichier dans le cas d'un moteur automatique
 +    * parameters: transfert les paramètres à donner aux moteurs. Il y a pour l'​instant 2 paramètres possibles :
 +      * lang : la langue du corpus -> doit permettre au moteur de trouver le modèle adapté
 +      * langs : une HashMap qui associe un fichier xml à traiter avec une langue
 +
 +Lors de l'​import,​ la méthode AnnotationEngine.processDirectory() du moteur sélectionné est appelée pour travailler sur le répertoire "​CORPUS/​txm"​ des fichiers XML-TXM.
 +
 +Si un moteur d'​annotation peut être utilisé dans une interface de TXM (annotation interactive) il doit implémenter le point d'​extension AnnotationArea. Cela lui permettra d'​être inclus dans la liste des outils d'​annotation disponibles du bouton "​Annoter"​ de la toolbar des éditeurs de résultats.
 ==== Automatique : TAL ==== ==== Automatique : TAL ====
  
 +  * [[public:​specs_annotation_nlp_api|Spécification de l'​annotation linguistique automatique]]
   * [[specs_import_annotation_lexicale_auto|Spécification de l'​annotation lexicale automatique]] :   * [[specs_import_annotation_lexicale_auto|Spécification de l'​annotation lexicale automatique]] :
-    * [[stanford_segmenter_and_tagger|Segmenteur et Tagger de Stanford]]+    * [[public:​annotation:​tal_treetagger|TreeTagger]] 
 +    * [[public:​annotation:​tal_udpipe|UDPipe]]
     * [[tal_talismane|Talismane]]     * [[tal_talismane|Talismane]]
 +    * [[stanford_segmenter_and_tagger|Segmenteur et Tagger de Stanford]]
     * [[tal_Melt|Melt]]     * [[tal_Melt|Melt]]
-    * [[public:​annotation:​tal_treetagger|TreeTagger]] 
   * [[specs_correction_tokenisation|Spécification de la re-segmentation et de la ré-annotation de mots]]   * [[specs_correction_tokenisation|Spécification de la re-segmentation et de la ré-annotation de mots]]
   * [[specs_import_annotation_syntaxique_auto|Spécification de l'​annotation syntaxique automatique]]   * [[specs_import_annotation_syntaxique_auto|Spécification de l'​annotation syntaxique automatique]]
 +    * [[specs_import_annotations|Spécification de l'​import d'​annotations syntaxiques]]
   * [[public:​specs_annotation_entites_nommees_auto|Spécification de l'​annotation en entités nommées automatique]]   * [[public:​specs_annotation_entites_nommees_auto|Spécification de l'​annotation en entités nommées automatique]]
  
public/annotation.txt · Dernière modification: 2021/06/25 10:14 par matthieu.decorde@ens-lyon.fr