Outils pour utilisateurs

Outils du site


public:import_xml

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:import_xml [2014/10/10 18:17]
matthieu.decorde@ens-lyon.fr
public:import_xml [2016/06/22 07:45] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 1: Ligne 1:
-====== Spécification du module d'​import XML/w+CSV ======+====== Spécification du futur module d'​import XML/w+CSV ======
  
 ===== Objectif ===== ===== Objectif =====
  
-Améliorer ​l'état actuel ​de l'import XML/w+CSV+Abaissement du niveau sémantique de l'​actuel import XML/W (0.7.6) et transférer une partie du sémantisme dans le module XTZ. 
 + 
 +Pour chacune des de étapes du modules des réductions sont à opérer.
  
 ==== Importer ==== ==== Importer ====
 +
 +Front XSL optionnelle
 +
 +Validation du formatage XML
 +
 +Les balises réservées sont :
 +  * text
 +    * les attributs sont conservés et utilisés comme metadonnées
 +    * si est présent un fichier metadata.csv,​ alors ces attributs peuvent être écrasés.
 +    * si le premier élément du texte est "​text"​ il est utilisé
 +  * w
 +    * les attributs sont conservés et utilisés comme propriété de mot dans les sous-éléments txm:ana
 +    * le contenu est utilisé pour créer le sous élément txm:form
 +
 +Le tokenizer XML Simple est appliqué
 +
 +==== Annotate ====
 +
 +Annotation optionnelle des mots avec [lang]lemma et [lang]pos.
 +
 ==== Compiler ==== ==== Compiler ====
 +
 +Tous les éléments contenu par l'​élément "​text"​ (inclus) sont transmit au fichier WTC.
 +
 +Les éléments w sont transformés en ligne tabulée.
 +
 ==== Édition ==== ==== Édition ====
-Faire évoluer le pager actuel ​pour gérer plus de cas et qu'il soit plus souple.+ 
 +Gérer un minimum de formatage : 
 +  * afficher les métadonnée de texte 
 +  * transmettre les éléments p 
 +  * générer des tooltips ​pour les propriétés ​de mots 
 ===== Méthode ===== ===== Méthode =====
 ==== Édition ==== ==== Édition ====
Ligne 15: Ligne 47:
   * [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​164|ticket #164]] sur la forge TXM.   * [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​164|ticket #164]] sur la forge TXM.
 ===== Solution ===== ===== Solution =====
-==== Édition ==== 
-Liste des éléments gérés par le module. 
-== Élément text == 
-  * crée un élement h3 avec @id 
-  * itère sur ses attributs pour afficher un tableau : nom + valeur 
-  * saute une ligne 
- 
-== Élément p == 
-  * crée un élément p 
-  * si @rend est renseigné il est utilisé pour remplir p@class 
- 
-== Élément lb == 
-  * crée un élément br 
- 
-== Élément de pagination indiqué dans le paramètre '​pageBreakTag'​ == 
-Par défaut '​pb'​ dans l'​initialisation du champ "Page break tag" du formulaire d'​import 
- 
-  * Si '​pageBreakTag'​ est vide, il ne faut couper les pages par un élément 
-  * Si non 
-    * coupe la page (avant ou après ??) au niveau de l'​élément en refermant les balises ouvertes puis en les ré-ouvrant 
-    * ajoute un numéro de page : crée un élément p centré dont le texte est affiché en rouge est : "- @n -"​. ​ 
- 
-== Element w == 
-  * créé un élément '​span'​ 
-  * attribut '​id'​ 
-  * attribut '​title'​ avec les propriétés du mot 
  
 ===== Recette ===== ===== Recette =====
public/import_xml.1412957824.txt.gz · Dernière modification: 2014/10/10 18:17 par matthieu.decorde@ens-lyon.fr