Outils pour utilisateurs

Outils du site


Panneau latéral

public:corpusrecode_command

Ceci est une ancienne révision du document !


Commande gestionnaire de propriété de mot de corpus

Objectif

Pouvoir recoder des propriétés de mots

Solution

Utiliser le mécanisme de ré-import mis en place avec le module d'import XTZ pour la sauvegarde des annotations. (il s'agit de mettre à jour les fichiers XML-TXM du corpus puis de reconstruire ses index et éditions de façon optimisée)

Paramètres :

  • un corpus (sélectionné dans la vue Corpus)
  • propriété source
  • propriété cible, peut être la propriété source si on souhaite la remplacer
  • paramètre gestionInconnus à la valeur 'abandon, 'copier' ou 'supprimer'
  • fichier de conversion (.tsv)
    • fichier tabulé
    • une règle par ligne
      • première colonne : pattern regexp
      • deuxième colonne : valeur de remplacement
    • les conversions sont appliquées dans l'ordre d'apparition du fichier de conversion
      • seule la première règle qui matche est déclenchée
    • si aucune règle ne matche et gestionInconnus == 'abandon'
      • écrire dans propriété cible : ERREUR(valeur de propriété source)
      • afficher les 10 premières erreurs différentes dans la console
      • afficher à la fin du traitement un message indiquant le nombre total de mots ayant eu une propriété source de valeur inconnue et le nombre total de valeurs inconnues différentes
    • si aucune règle ne matche et gestionInconnus == 'copier'
      • copier dans propriété cible la valeur de la propriété source
    • si aucune règle ne matche et gestionInconnus == 'supprimer'
      • écrire dans propriété cible le code prévu pour UNDEF
public/corpusrecode_command.1469203930.txt.gz · Dernière modification: 2016/07/22 18:12 par slh@ens-lyon.fr