Outils pour utilisateurs

Outils du site


public:spec_corpus_alignes

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:spec_corpus_alignes [2020/02/28 15:59]
slh@ens-lyon.fr [Recette]
public:spec_corpus_alignes [2020/02/28 16:34] (Version actuelle)
slh@ens-lyon.fr [WordProperties2Word]
Ligne 129: Ligne 129:
 ==== WordProperties2Word ==== ==== WordProperties2Word ====
  
-L'​utilitaire WordProperties2Word permet de recoder la surface textuelle d'un corpus, au sens où il produit une nouvelle version des fichiers pivots source XML-TXM d'un corpus TXM où seulement certains mots du corpus d'​origine sont présents - en respectant l'​ordre d'​origine des mots du corpus. Les mots sont sélectionnés à partir d'une propriété particulière des mots d'​origine (paramètre //​word_property//​ de l'​utilitaire). La valeur de cette propriété est utilisée pour encoder la forme graphique des mots du nouveau corpus, les autres propriétés de mots étant par ailleurs transférées aux nouveaux mots. Les mots d'​origine n'​ayant pas de valeur ou une valeur vide pour cette propriété sont ignorés dans la construction du nouveau corpus.+L'​utilitaire WordProperties2Word permet de recoder la surface textuelle d'un corpus, au sens où il produit une nouvelle version des fichiers pivots source XML-TXM d'un corpus TXM où seulement certains mots du corpus d'​origine sont présents - en respectant l'​ordre d'​origine des mots du corpus. Les mots sont sélectionnés à partir d'une propriété particulière des mots d'​origine (paramètre //​word_property//​ de l'​utilitaire). La valeur de cette propriété est utilisée pour encoder la forme graphique des mots du nouveau corpus, les autres propriétés de mots étant par ailleurs transférées aux nouveaux mots. Les mots d'​origine n'​ayant pas de valeur ou une valeur vide pour cette propriété sont ignorés dans la construction du nouveau corpus. Les structures et leurs propriétés sont transférées dans le nouveau corpus.
  
 Le répertoire de sources XML-TXM produit peut alors être importé, par exemple, avec le module XTZ en l'​équipant d'un répertoire de pré-traitement '​2-front'​ avec la feuille XSLT '​txm-front-teitxm2xmlw.xsl'​ pour redresser les propriétés de mots. Le répertoire de sources XML-TXM produit peut alors être importé, par exemple, avec le module XTZ en l'​équipant d'un répertoire de pré-traitement '​2-front'​ avec la feuille XSLT '​txm-front-teitxm2xmlw.xsl'​ pour redresser les propriétés de mots.
public/spec_corpus_alignes.txt · Dernière modification: 2020/02/28 16:34 par slh@ens-lyon.fr