Outils pour utilisateurs

Outils du site


public:specs_alignement_identifiants

Alignement identifiants

Boite à outils (scripts) pour aider à ré-aligner des corpus ayant perdu des identifiants (typiquement, de mots).

Stratégie :

  • phase I :idéale
    • l'alignement correspond parfaitement, un outil ré-injecte les identifiants au bon endroit
  • phase II : ajouts, suppressions, interversions
    • 1) appliquer un DIFF pour détecter les écarts
    • 2) utiliser les écarts pour ré-injecter les identifiants au bon endroit : manuellement ou semi-automatiquement ou automagiquement

Données manipulées :

  • a) textes de référence avec des mots et des identifiants, en XML-TXM
  • b) textes dans d'autres formats à aligner
    • exemple TIGER dans lequel injecter des t@id depuis les w@id
public/specs_alignement_identifiants.txt · Dernière modification : 10/10/2019 13:44 de slh@ens-lyon.fr