Outils pour utilisateurs

Outils du site


public:spec_corpus_binaire

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:spec_corpus_binaire [2017/10/06 10:45]
matthieu.decorde@ens-lyon.fr
public:spec_corpus_binaire [2019/08/23 11:33] (Version actuelle)
matthieu.decorde@ens-lyon.fr [TXM 0.8.0]
Ligne 32: Ligne 32:
     * répertoire "​tokenized",​ contient le résultat du Tokenizer appliqué lors de l'​import     * répertoire "​tokenized",​ contient le résultat du Tokenizer appliqué lors de l'​import
     * répertoire "​temporary_annotations",​ il est généré lors que l'on débute une session d'​annotation     * répertoire "​temporary_annotations",​ il est généré lors que l'on débute une session d'​annotation
 +
 +
 +==== TXM 0.8.0 ====
 +
 +L'​architecture des fichiers reprend celle de TXM 0.7.8 mais change la localisation et la technologie de persistance des paramètres d'​import et des paramètres de corpus : le fichier import.xml n'est plus utilisé et est remplacer par le répertoire "​.settings"​ qui contient les fichiers de préférences RCP du projet RCP hébergeant le projet de corpus TXM.
 +
 +Contenu type du répertoire "​.settings"​ :
 +  * 1 txm_XYZ_Project.prefs : contient les paramètres d'​import
 +  * 1 EditionDefinition.prefs : contient les paramètres d'​import concernant la création d'​édition ​
 +  * 1 txm_XYZ_MainCorpus.prefs : contient les paramètres de corpus
 +  * 1 ou plusieurs txm_XYZ_Text.prefs : contiennent les paramètres de textes
 +  * 1 ou plusieurs txm_XYZ_Edition.prefs : contiennent les paramètres d'​édition et les index mots <-> page d'​édition
 +
 +Les fichiers "​txm_XTZ_NomDeClasseJava.prefs"​ sont des persistances de résultats introduit dans TXM 0.8.0: les champs généraux sont décrit dans la page de spécification de la [[public:​persistance_resultats|persistance des résultats de TXM]].
 +
 +txm_XYZ_Project.prefs :
 +  * décrit les paramètre d'​import : le projet de (création de) corpus
 +  * champs :
 +    * annotate : true/false -> déclanche l'​annotation TreeTagger ou pas
 +    * clean.directories : true/false : supprime les fichiers temporaires ou pas
 +    * encoding : UTF-8 par défaut : encodage des textes
 +    * font : vide par défaut : règle la font d'​affichage des résultats
 +    * import_module_name : pas de valeur par défaut : nom du module d'​import à utiliser. TXM utilisera ce nom pour lancer le script point d'​entrée xyzLoader.groovy du package org.txm.scripts.importer du répertoire de sources Groovy TXMHOME/​scripts/​groovy/​user
 +    * lang : la langue du corpus (aussi utilisé pour résoudre le nom du modèle TreeTagger à utiliser)
 +    * user_name : nom du corpus à créer
 +    * source : répertoire des fichiers sources à lire
  
 ====== Évolutions possibles ​ pour séparer les paramètres d'​import des fichiers sources ===== ====== Évolutions possibles ​ pour séparer les paramètres d'​import des fichiers sources =====
public/spec_corpus_binaire.1507279501.txt.gz · Dernière modification: 2017/10/06 10:45 par matthieu.decorde@ens-lyon.fr