Outils pour utilisateurs

Outils du site


public:environnement_import

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:environnement_import [2014/05/28 11:57]
matthieu.decorde@ens-lyon.fr
public:environnement_import [2015/10/14 15:51]
slh@ens-lyon.fr
Ligne 3: Ligne 3:
 ===== Objectifs ===== ===== Objectifs =====
  
-==== Indexation et stylage des éléments XML ==== 
-(Copié à partir du [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​164|ticket #164]]) 
  
-The import interface should allow to declare XML elements (namespace aware) into 4 classes: 
-  - structure&​edition (default) 
-    * intermediate structures in the cwb corpus 
-    * <span class="​[element-name]">​...</​span>​ in the edition 
-  - out-of-text&​in-edition 
-    * content deleted from the cwb corpus 
-    * <span class="​[element-name]">​...</​span>​ in the edition 
-  - ignore 
-    * tags deleted, content preserved in cwb corpus and in the editions 
-  - delete 
-    * tags and their content deleted from cwb corpus and editions 
- 
-Special elements: 
-  - pagination element (*:pb by default) 
-    * used to paginate editions and in references 
-  - reference elements 
-    * list of elements used to build references 
-    * possibility to specify the attribute to use (@n by default) 
-    * possibility to specify the prefix to display in references (e.g. ', v. ' for verse numbers) 
  
 ==== Compte rendu de la conférence TEI 2013 Rome ==== ==== Compte rendu de la conférence TEI 2013 Rome ====
Ligne 49: Ligne 28:
 ==== BUG import XML/w + CSV de TXM 0.7.5 : fichiers Tild et cachés ==== ==== BUG import XML/w + CSV de TXM 0.7.5 : fichiers Tild et cachés ====
 Ticket : [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​824]] Ticket : [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​824]]
 +
 === Déroulement de l'​import === === Déroulement de l'​import ===
   * Démarrage d'un import : xmlLoader.groovy,​ stocké chez l'​utilisateur et qui ne peut pas être mis à jour. Ce fichier drive les différentes étapes d'un module d'​import   * Démarrage d'un import : xmlLoader.groovy,​ stocké chez l'​utilisateur et qui ne peut pas être mis à jour. Ce fichier drive les différentes étapes d'un module d'​import
Ligne 60: Ligne 40:
     - Lecture des metadonnéees du fichier metadata.csv     - Lecture des metadonnéees du fichier metadata.csv
     - étape importer (XXX -> XML-TXM)     - étape importer (XXX -> XML-TXM)
-      * Validation et Sélection des fichiers XML (*.xml) du dossier *BIN/txm** (si XSL)+      * Validation et Sélection des fichiers XML (.xml) du dossier ​**BIN/txm** (si XSL)
       * Tokenize avec SimpleTokenizerXml       * Tokenize avec SimpleTokenizerXml
       * Transforme en XML-TXM avec Xml2Ana et les enregistre dans **BIN/txm**       * Transforme en XML-TXM avec Xml2Ana et les enregistre dans **BIN/txm**
Ligne 70: Ligne 50:
       * Injection des annotations dans les fichiers XML-TXM       * Injection des annotations dans les fichiers XML-TXM
     - étape compiler     - étape compiler
-      * Créer une fichier "*.wtc" à partir de tous les fichiers du dossier **BIN/txm**+      * Créer une fichier "​.wtc"​ à partir de tous les fichiers du dossier **BIN/txm**
     - étape pager     - étape pager
-      * Créer les fichiers "*.html" à partir de tous les fichiers du dossier **BIN/txm**+      * Créer les fichiers "​.html"​ à partir de tous les fichiers du dossier **BIN/txm**
  
 === Correction du bug === === Correction du bug ===
Ligne 84: Ligne 64:
 Le point 4 devrait : Le point 4 devrait :
   * ne pas copier les fichiers cachés (ignorer Tild, caché, etc.)   * ne pas copier les fichiers cachés (ignorer Tild, caché, etc.)
 +
 +L'​étape importer, doit supprimer les fichiers cachés, Tild, etc. présents dans **BIN/txm** avant de commencer tout traitement
  
 == Patch pour la 0.7.5 == == Patch pour la 0.7.5 ==
public/environnement_import.txt · Dernière modification: 2015/10/14 15:51 par slh@ens-lyon.fr