Outils pour utilisateurs

Outils du site


public:spec_exploitation_annotation

Ceci est une ancienne révision du document !


Exploitation de l'annotation

L'annotation est soit :

  • pré-encodée en XML-TEI ou autre format
  • calculée à la volée lors de l'import : exemple TreeTagger
  • calculée à la demande par une extension : exemple TreeTagger
  • saisie de façon assistée dans TXM
    • par concordances
    • par édition

Elle est ensuite :

  • projetée (réduction XML-TEI → CQL) pour exploitation dans CQP
  • importée directement pour exploitation : exemple TIGERSearch
  • exploitée par moteur : exemple CQP ou TIGERSearch
  • exploitée de façon combinée : exemple CQP et TIGERSearch, CQP et XQuery
  • transformée pour construire des éditions de textes (pagination, mise en forme, flyover)
  • transférée entre représentations : exemple transfert d'URS vers CQL (?)

Annotation de textes - métadonnées

  • metadata.csv

Annotation infra textes - structuration, etc. -> plans textuels

  • XML-TEI

Annotation lexicale

  • TreeTagger

Annotation syntaxique

  • TIGERSearch

Annotation sémantique

  • SyMoGIH

Annotation URS-Glozz-Analec

Le modèle initial URS concerne l'annotation d'un texte.

L'implémentation TXM étend le modèle :

  • à un corpus de textes plutôt qu'à un seul texte
  • à des textes structurés
  • à des objets composites comme une partition1)

Il s'agit ensuite de combiner l'exploitation de ces annotations avec les autres comme les structures CQL. Remarque : si CQL s'avère trop limité pour gérer les structures d'origine, on peut envisager une combinaison plutôt avec le moteur XQuery sur la base de la représentation XML-TXM des textes.

1)
composée d'un ensemble de sous-corpus disjoints
public/spec_exploitation_annotation.1510320384.txt.gz · Dernière modification: 2017/11/10 14:26 par slh@ens-lyon.fr