Outils pour utilisateurs

Outils du site


public:spec_corpus_mutable

Corpus mutable

Il s'agit de pouvoir remettre en cause les données d'un corpus depuis TXM, de façon permanente, typiquement suite à une interprétation dans le cade d'un travail d'analyse (augmentation de données, correction de données…). Il s'agit d'un point de vue de principe : la mise en oeuvre peut être difficile à réaliser selon les contextes, voire contre-indiquée, par principe méthodologique.

Pas mutation

TXM peut aider à préparer les sources d'un corpus avant import → Source Workbench, ce n'est pas tout à fait du corpus mutable. C'est plutôt ce qu'on appelle de l'encodage de corpus (en amont du travail d'analyse) :

  • macros de manipulation TXT : split, merge…
  • macros de manipulation XML : synthèses, vérifications, ajout de propriétés…
  • éditeur TXT
  • éditeur XML
  • appel de TreeTagger pendant l'import
  • etc.

On pourrait également aider à régler le tableau de métadonnées dans l'onglet de vérification du formulaire de paramètres d'import, ce qu'on s'empêche de faire pour l'instant → ce n'est pas tout à fait du corpus mutable.

Mutation

Les outils d'annotation au sein de TXM, recouvrant les données d'un corpus, permettent de muter un corpus (à partir de vues aval, résultats d'outils d'analyse) :

  • annotation URS plein texte
  • annotation URS par concordance
  • annotation de mots par concordance
  • annotation de structures par concordance
  • appel de TreeTagger sur un corpus

La sauvegarde des annotations au sein du XML-TXM est une façon d'éditer le corpus.

On peut également aider à éditer directement la représentation pivot XML-TXM avec l'éditeur XML interne (la représentation XML-TXM est plus précise que la représentation CQP par exemple). Voir ci-dessous,

Édition directe de la représentation pivot XML-TXM d'un texte

  • dans une page d'édition de texte
    • menu contextuel sur un mot, “Éditer” :
      • ouverture de l'éditeur XML avec le fichier XML-TXM du texte, sur le mot (<w>…</w>) sélectionné
      • bouton “Enregistrer” barre d'outils = enregister le XML + “Corpus > Mettre à jour”
      • bouton “Enregistrer et fermer” = comme “Enregistrer” + fermeture de l'éditeur XML et ré-affichage de la page d'édition avec le mot d'appel mis en évidence
  • dans une concordance
    • menu contextuel sur une ligne, “Éditer” :
      • ouverture de l'éditeur XML avec le fichier XML-TXM du texte, sur les mots du pivot (<w>…</w>…<w>…</w>…<w>…</w>) sélectionnés
      • bouton “Enregistrer” barre d'outils = enregister le XML + “Corpus > Mettre à jour”
      • bouton “Enregistrer et fermer” = comme “Enregistrer” + fermeture de l'éditeur XML, re-calcul de la concordance et focus sur la première ligne de la concordance contenant un des mots d'appel
  • etc.
public/spec_corpus_mutable.txt · Dernière modification : 15/10/2019 10:41 de slh@ens-lyon.fr