Outils pour utilisateurs

Outils du site


public:import_xml

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:import_xml [2013/11/15 16:09]
matthieu.decorde@ens-lyon.fr
public:import_xml [2016/06/22 07:45] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 1: Ligne 1:
-====== Spécification du module d'​import XML/w+CSV ======+====== Spécification du futur module d'​import XML/w+CSV ======
  
 ===== Objectif ===== ===== Objectif =====
  
-Améliorer l'​état ​de l'​actuel import XML/w+CSV+Abaissement du niveau sémantique ​de l'​actuel import XML/W (0.7.6) et transférer une partie du sémantisme dans le module XTZ. 
 + 
 +Pour chacune des de étapes du modules des réductions sont à opérer.
  
-===== Méthode ===== 
 ==== Importer ==== ==== Importer ====
-==== Compiler ==== 
-==== Edition ==== 
-Faire évoluer le pager actuel pour gérer plus de cas et qu'il soit plus souple. 
  
-Tickets liés : +Front XSL optionnelle
-  * [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​164|ticket #164]] sur la forge TXM.+
  
-=== État de la plateforme === +Validation du formatage XML
-Dans la version 0.7.5. +
-== Element text == +
-  * crée un élement h3 avec @id +
-  * itère sur ses attributs pour afficher un tableau : nom + valeur +
-  * saute une ligne+
  
-== Element head == +Les balises réservées sont : 
-  * crée un élément ​h2 avec le contenu ​de la balise head+  * text 
 +    * les attributs sont conservés et utilisés comme metadonnées 
 +    * si est présent ​un fichier metadata.csv,​ alors ces attributs peuvent être écrasés. 
 +    * si le premier ​élément ​du texte est "​text"​ il est utilisé 
 +  * w 
 +    * les attributs sont conservés et utilisés comme propriété de mot dans les sous-éléments txm:ana 
 +    * le contenu ​est utilisé pour créer le sous élément txm:form
  
-== Element note  == +Le tokenizer XML Simple ​est appliqué
-  * crée un span contenant le texte "​[*]"​ en rouge avec un tooltip qui contient le contenu des w/form et du texte hors w +
-    * le contenu des notes est normalement tokenisé et indexé par le moteur de recherche (mais le retour au texte est impossible à partir de concordances) +
-    * pour ne pas indexer le contenu des notes, il faut ajouter une ligne "​ignoredelements=note"​ dans le fichier import.properties (cf. [[http://​txm.sourceforge.net/​doc/​manual/​manual48.xhtml#​toc166|Le Manuel de référence TXM]]) +
-    * dans ce cas, on peut dupliquer les notes lors de la préparation du corpus et placer les doublons à la fin du document dans <p rend="​note">​+
  
-== Element graphic ​== +==== Annotate ====
-  * si @url est renseigné, crée une balise img dans une balise div et utilise graphic@url pour renseigner img@src+
  
-== Elements lg, p et q == +Annotation optionnelle des mots avec [lang]lemma ​et [lang]pos.
-  * crée un élément p +
-  * si @rend est renseigné il est utilisé pour remplir p@class+
  
-== Elements lb et br == +==== Compiler ====
-  * crée un élément br+
  
-== Element pb (ou l'​élément ​de pagination indiqué dans import.properties== +Tous les éléments contenu par l'​élément ​"​text"​ (inclussont transmit au fichier WTC.
-  * coupe la page en refermant les balises ouvertes puis en les ré-ouvrant +
-  * crée un élément p centré dont le texte est affiché en rouge. Le contenu du p est la valeur de l'​attribut @n.+
  
 +Les éléments w sont transformés en ligne tabulée.
 +
 +==== Édition ====
 +
 +Gérer un minimum de formatage :
 +  * afficher les métadonnée de texte
 +  * transmettre les éléments p
 +  * générer des tooltips pour les propriétés de mots
 +
 +===== Méthode =====
 +==== Édition ====
 +
 +Tickets liés :
 +  * [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​164|ticket #164]] sur la forge TXM.
 ===== Solution ===== ===== Solution =====
-==== Edition ==== 
-=== Proposition 1 : stylage CSS === 
-=== Proposition 2 : XML + CSS === 
  
 ===== Recette ===== ===== Recette =====
Ligne 54: Ligne 53:
 === Beta === === Beta ===
 ==== État courant ==== ==== État courant ====
-Qui Quant Quoi+
public/import_xml.1384528176.txt.gz · Dernière modification: 2013/11/15 16:09 par matthieu.decorde@ens-lyon.fr