Outils pour utilisateurs

Outils du site


Panneau latéral

public:spec_formulaire_parametres_import

Formulaire de paramètres d'import

Permet de paramétrer l'import d'un corpus dans TXM :

  • sélection des sources
  • nommage du corpus
  • commentaires
  • langue
  • tokenisation
  • ajouter une préférence 'Ordre du corpus' dans la section 'Options' à tous les formulaires
    • les valeurs possibles sont les noms de métadonnées
    • la valeur par défaut est 'textorder'

Le formulaire se présente dans un éditeur organisé en sections. Certaines sont obligatoires (répertoire des sources, nom du corpus), d'autres sont optionnelles et dépendent du module d'import sélectionné à l'ouverture (la section XSL n'est disponible que pour les modules d'import qui traitent des fichiers XML).

Chaque Section va impacter une ou plusieurs étape du module d'import. RQ: pour la lisibilité du formulaire, faudrait-il limiter une section à une étape d'import. Ou alors bien mettre en valeur les sections partagées par les étapes

Section : Edition

Cette section organise les éditions disponibles et leurs options.

paramètres partagés

  • édition par défaut : “default”

"default"

  • construire l'édition
  • Nombre de mots
  • élément de pagination
  • éléments notes

"facs"

  • construire l'édition
  • répertoire d'image

Section : Plans textuels

Les plans textuels sont les zones des sources d'un corpus qui contiennent les mots à indexer.

Les plans textuels ne concernent pas les styles d'affichage des éditions (ex: les notes)

Exemple : Le hors-texte représente les zones sans mots à indexer. Exemple 2 : Le teiHeader est typiquement du hors-texte.

Ciblage du hors texte

Du plus simple au plus complet, du hors texte peut être défini par :

  • une liste de nom de balises (TXM 0.7.9 et TXM 0.8.0)
  • une liste de nom de balises+attributs
  • une Xpath
  • une liste de XPath
  • une liste d'identifiant d'élément

et un nom (ex: “titres” , “corps”)

Section : Commandes

Concordances

  • Structures délimitant les contextes de concordances
    • valeur : liste de noms de structures
    • exemple : “text,div”
  • Default reference pattern / Patron des références par défaut
    • valeur : chaine de caractères pouvant contenir des variables désignant des propriétés de mots ou de structures. Les propriétés de structures utilisent le patron ${struct_prop} et les propriétés de mots utilisent le patron ${prop}.
    • exemple : “${text_id}, ${div_n}, p. ${pb_n}” pour <identifiant du texte>, <numéro de la section>, “p.”, <numéro de page>
    • tooltip :
      • EN: “Default reference pattern. Properties must be wrapped in '${…}' tags. Structure properties use the ${struct_prop} pattern and word properties use the ${prop} pattern. Example 'text id = ${text_id} and word = ${word}'”
      • FR: “Patron des références par défaut. Les propriétés doivent être enveloppées dans des balises '${…}'. Les propriétés de structures utilisent le patron ${struct_prop} et les propriétés de mots utilisent le patron ${prop}. Exemple 'identifiant de texte = ${text_id} et mot = ${word}'”.
public/spec_formulaire_parametres_import.txt · Dernière modification: 2021/03/08 15:35 par slh@ens-lyon.fr