Outils pour utilisateurs

Outils du site


public:import_xml

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:import_xml [2013/11/15 15:37]
matthieu.decorde@ens-lyon.fr
public:import_xml [2016/06/22 07:45] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 1: Ligne 1:
-====== Spécification du module d'​import XML/w+CSV ======+====== Spécification du futur module d'​import XML/w+CSV ======
  
-Tickets liés : +===== Objectif =====
-  * [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​164|ticket #164]] sur la forge TXM.+
  
 +Abaissement du niveau sémantique de l'​actuel import XML/W (0.7.6) et transférer une partie du sémantisme dans le module XTZ.
  
-===== Objectif =====+Pour chacune des de étapes du modules des réductions sont à opérer.
  
-Améliorer l'​état de l'​actuel import XML/​w+CSV. ​+==== Importer ====
  
-==== Editions ==== +Front XSL optionnelle
-Faire évoluer le pager actuel pour gérer plus de cas et qu'il soit plus souple.+
  
-=== Dans la version 0.7.5 ===+Validation du formatage XML
  
-== Element text == +Les balises réservées sont : 
-  * crée un élement h3 avec @id +  * text 
-  * itère sur ses attributs ​pour afficher un tableau ​nom + valeur +    * les attributs sont conservés et utilisés comme metadonnées 
-  saute une ligne+    * si est présent ​un fichier metadata.csv,​ alors ces attributs peuvent être écrasés. 
 +    * si le premier élément du texte est "​text"​ il est utilisé 
 +  * 
 +    * les attributs ​sont conservés et utilisés comme propriété de mot dans les sous-éléments txm:ana 
 +    le contenu est utilisé pour créer le sous élément txm:form
  
-== Element head == +Le tokenizer XML Simple est appliqué
-  * crée un élément h2 avec le contenu de la balise head+
  
-== Element note  ​== +==== Annotate ====
-  * crée un span contenant le texte "​[*]"​ en rouge avec un tooltip qui contient le contenu des w/form et du texte hors w +
-    * le contenu des notes est normalement tokenisé et indexé par le moteur de recherche (mais le retour au texte est impossible à partir de concordances) +
-    * pour ne pas indexer le contenu des notes, il faut ajouter une ligne "​ignoredelements=note" dans le fichier import.properties (cf. [[http://​txm.sourceforge.net/​doc/​manual/​manual48.xhtml#​toc166|Le Manuel de référence TXM]]) +
-    * dans ce cas, on peut dupliquer les notes lors de la préparation du corpus et placer les doublons à la fin du document dans <p rend="​note">​+
  
-== Element graphic == +Annotation optionnelle des mots avec [lang]lemma ​et [lang]pos.
-  * si @url est renseigné, crée une balise img dans une balise div et utilise graphic@url pour renseigner img@src+
  
-== Elements lg, p et q == +==== Compiler ====
-  * crée un élément p +
-  * si @rend est renseigné il est utilisé pour remplir p@class+
  
-== Elements lb et br == +Tous les éléments contenu par l'élément ​"​text"​ (inclus) sont transmit au fichier WTC.
-  * crée un élément ​br+
  
-== Element pb (ou l'​élément de pagination indiqué dans import.properties) == +Les éléments w sont transformés ​en ligne tabulée.
-  * coupe la page en refermant les balises ouvertes puis en les ré-ouvrant +
-  * crée un élément p centré dont le texte est affiché en rouge. Le contenu du p est la valeur de l'​attribut @n.+
  
 +==== Édition ====
  
-=== Proposition 1 stylage CSS === +Gérer un minimum de formatage ​
-=== Proposition 2 : XML + CSS ===+  * afficher les métadonnée de texte 
 +  * transmettre les éléments p 
 +  * générer des tooltips pour les propriétés de mots
  
 ===== Méthode ===== ===== Méthode =====
 +==== Édition ====
  
 +Tickets liés :
 +  * [[https://​forge.cbp.ens-lyon.fr/​redmine/​issues/​164|ticket #164]] sur la forge TXM.
 ===== Solution ===== ===== Solution =====
- 
-===== Protocole de test ===== 
  
 ===== Recette ===== ===== Recette =====
 +==== Protocole de test ====
 +=== Alpha ===
 +=== Beta ===
 +==== État courant ====
 +
public/import_xml.1384526278.txt.gz · Dernière modification: 2013/11/15 15:37 par matthieu.decorde@ens-lyon.fr