Outils pour utilisateurs

Outils du site


public:spec_formulaire_parametres_import

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:spec_formulaire_parametres_import [2019/04/17 11:11]
slh@ens-lyon.fr
public:spec_formulaire_parametres_import [2020/02/10 17:28] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 1: Ligne 1:
 ====== Formulaire de paramètres d'​import ====== ====== Formulaire de paramètres d'​import ======
  
-===== Objectifs ===== +Permet ​de paramétrer l'​import ​d'un corpus dans TXM : 
- +  * sélection ​des sources 
-  * pouvoir préciser module par module ou de façon générale : +  nommage ​du corpus 
-    * certains paramètres d'​import : où est le répertoire ​des sources, xsl, lemmatiser ou pas... +  * commentaires 
-    certaines propriétés ​du corpus ​: nom, langue, ​commentaires... +  * langue 
- +  * tokenisation 
-===== Développements possibles ===== +  * ...
   * ajouter une préférence 'Ordre du corpus'​ dans la section '​Options'​ à tous les formulaires   * ajouter une préférence 'Ordre du corpus'​ dans la section '​Options'​ à tous les formulaires
     * les valeurs possibles sont les noms de métadonnées     * les valeurs possibles sont les noms de métadonnées
     * la valeur par défaut est '​textorder'​     * la valeur par défaut est '​textorder'​
  
 +Le formulaire se présente dans un éditeur organisé en sections. Certaines sont obligatoires (répertoire des sources, nom du corpus), d'​autres sont optionnelles et dépendent du module d'​import sélectionné à l'​ouverture (la section XSL n'est disponible que pour les modules d'​import qui traitent des fichiers XML).
 +
 +Chaque Section va impacter une ou plusieurs étape du module d'​import. RQ: pour la lisibilité du formulaire, faudrait-il limiter une section à une étape d'​import. Ou alors bien mettre en valeur les sections partagées par les étapes
 +
 +===== Section: Edition =====
 +
 +Cette section organise les éditions disponibles et leurs options.
 +
 +==== paramètres partagés ====
 +
 +   * édition par défaut : "​default"​
 +
 +==== "​default"​ ====
 +
 +   * construire l'​édition
 +   * Nombre de mots
 +   * élément de pagination
 +   * éléments notes
 +
 +==== "​facs"​ ====
 +
 +  * construire l'​édition
 +  * répertoire d'​image
 +
 +===== Section: Plans textuels =====
 +
 +Les plans textuels sont les zones des sources d'un corpus qui contiennent les mots à indexer.
 +
 +Les plans textuels ne concernent pas les styles d'​affichage des éditions (ex: les notes)
 +
 +Exemple : Le hors-texte représente les zones sans mots à indexer.
 +Exemple 2 : Le teiHeader est typiquement du hors-texte.
 +
 +==== Ciblage du hors texte ====
 +
 +Du plus simple au plus complet, du hors texte peut être défini par :
 +  * une liste de nom de balises (TXM 0.7.9 et TXM 0.8.0)
 +  * une liste de nom de balises+attributs
 +  * ...
 +  * une Xpath
 +  * une liste de XPath
 +  * une liste d'​identifiant d'​élément
 +
 +et un nom (ex: "​titres"​ , "​corps"​)
public/spec_formulaire_parametres_import.1555492266.txt.gz · Dernière modification: 2019/04/17 11:11 par slh@ens-lyon.fr