Outils pour utilisateurs

Outils du site


public:spec_corpus_mutable

Ceci est une ancienne révision du document !


Corpus mutable

Il s'agit de pouvoir remettre en cause les données d'un corpus depuis TXM, typiquement suite à une interprétation dans le cade d'un travail d'analyse (augmentation de données, correction de données…). Il s'agit d'un point de vue de principe : la mise en oeuvre peut être difficile à réaliser selon les contextes, voire contre-indiquée, par principe méthodologique.

TXM peut aider à préparer les sources d'un corpus avant import → Source Workbench, ce n'est pas tout à fait du corpus mutable :

  • macros de manipulation TXT : split, merge…
  • macros de manipulation XML : synthèses, vérifications, ajout de propriétés…
  • éditeur TXT
  • éditeur XML
  • etc.

On pourrait également aider à régler le tableau de métadonnées dans l'onglet de vérification du formulaire de paramètres d'import, ce qu'on s'empêche de faire pour l'instant, ce n'est pas tout à fait du corpus mutable.

Les outils d'annotations au sein de TXM, recouvrant les données d'un corpus, permettent de muter un corpus. La sauvegarde des annotations au sein du XML-TXM est une façon d'éditer le corpus.

On peut également aider à éditer directement la représentation pivot XML-TXM avec l'éditeur XML interne (la représentation XML-TXM est plus précise que la représentation CQP par exemple).

Édition directe de la représentation pivot XML-TXM d'un texte

  • dans une page d'édition de texte
    1. menu contextuel sur un mot : “Éditer” → ouverture de l'éditeur XML avec le fichier XML-TXM du texte, sur le mot (<w>…</w>) sélectionné. bouton “Enregistrer” barre d'outils → “Corpus > Mettre à jour”
public/spec_corpus_mutable.1570462541.txt.gz · Dernière modification: 2019/10/07 17:35 par slh@ens-lyon.fr