Outils pour utilisateurs

Outils du site


public:spec_corpus_binaire

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:spec_corpus_binaire [2017/08/02 11:22]
matthieu.decorde@ens-lyon.fr
public:spec_corpus_binaire [2020/06/11 14:59] (Version actuelle)
slh@ens-lyon.fr [Assurer la récupération et rétro-compatibilité des corpus entre versions de TXM]
Ligne 32: Ligne 32:
     * répertoire "​tokenized",​ contient le résultat du Tokenizer appliqué lors de l'​import     * répertoire "​tokenized",​ contient le résultat du Tokenizer appliqué lors de l'​import
     * répertoire "​temporary_annotations",​ il est généré lors que l'on débute une session d'​annotation     * répertoire "​temporary_annotations",​ il est généré lors que l'on débute une session d'​annotation
 +
 +
 +==== TXM 0.8.0 ====
 +
 +L'​architecture des fichiers reprend celle de TXM 0.7.8 mais change la localisation et la technologie de persistance des paramètres d'​import et des paramètres de corpus : le fichier import.xml n'est plus utilisé et est remplacer par le répertoire "​.settings"​ qui contient les fichiers de préférences RCP du projet RCP hébergeant le projet de corpus TXM.
 +
 +Contenu type du répertoire "​.settings"​ :
 +  * 1 txm_XYZ_Project.prefs : contient les paramètres d'​import
 +  * 1 EditionDefinition.prefs : contient les paramètres d'​import concernant la création d'​édition ​
 +  * 1 txm_XYZ_MainCorpus.prefs : contient les paramètres de corpus
 +  * 1 ou plusieurs txm_XYZ_Text.prefs : contiennent les paramètres de textes
 +  * 1 ou plusieurs txm_XYZ_Edition.prefs : contiennent les paramètres d'​édition et les index mots <-> page d'​édition
 +
 +Les fichiers "​txm_XTZ_NomDeClasseJava.prefs"​ sont des persistances de résultats introduit dans TXM 0.8.0: les champs généraux sont décrit dans la page de spécification de la [[public:​persistance_resultats|persistance des résultats de TXM]].
 +
 +txm_XYZ_Project.prefs :
 +  * décrit les paramètre d'​import : le projet de (création de) corpus
 +  * champs :
 +    * annotate : true/false -> déclanche l'​annotation TreeTagger ou pas
 +    * clean.directories : true/false : supprime les fichiers temporaires ou pas
 +    * encoding : UTF-8 par défaut : encodage des textes
 +    * font : vide par défaut : règle la font d'​affichage des résultats
 +    * import_module_name : pas de valeur par défaut : nom du module d'​import à utiliser. TXM utilisera ce nom pour lancer le script point d'​entrée xyzLoader.groovy du package org.txm.scripts.importer du répertoire de sources Groovy TXMHOME/​scripts/​groovy/​user
 +    * lang : la langue du corpus (aussi utilisé pour résoudre le nom du modèle TreeTagger à utiliser)
 +    * user_name : nom du corpus à créer
 +    * source : répertoire des fichiers sources à lire
 +
 +====== Assurer la récupération et rétro-compatibilité des corpus entre versions de TXM =====
 +
 +A chaque version de TXM l'​architecture des corpus peut évoluer. Même sans remettre en cause l'​architecture elle-même, des paramètres internes peuvent évoluer.
 +
 +Par exemple : un corpus importé en TRS en 0.8.0, ne disposera pas des paramètres de corpus réglant le retour au média nécessaires au fonctionnement de l'​extension Media Player dans TXM 0.8.1.
 +
 +Avec TXM 0.8.0 et 0.8.1, la mise en place de la persistence des paramètres peut être un support au maintien de la rétro-compatibilité pour autant que chaque commande, ou extension, connaisse les évolutions entre chaque version de TXM.
  
 ====== Évolutions possibles ​ pour séparer les paramètres d'​import des fichiers sources ===== ====== Évolutions possibles ​ pour séparer les paramètres d'​import des fichiers sources =====
Ligne 48: Ligne 82:
  bin  bin
  CORPUSNAME1  CORPUSNAME1
- data + cqp 
- html + tiger 
- txm+ media 
 + annotations 
 + analec 
 + edition 
 + xml-txm
  CORPUSNAME2  CORPUSNAME2
- data + cqp 
- html + edition 
- txm+ xml-txm
  configuration  configuration
  CORPUSNAME1  CORPUSNAME1
public/spec_corpus_binaire.1501665736.txt.gz · Dernière modification: 2017/08/02 11:22 par matthieu.decorde@ens-lyon.fr