Outils pour utilisateurs

Outils du site


public:import_xml

Ceci est une ancienne révision du document !


Spécification du module d'import XML/w+CSV

Objectif

Améliorer l'état actuel de l'import XML/w+CSV.

Importer

Compiler

Edition

Faire évoluer le pager actuel pour gérer plus de cas et qu'il soit plus souple.

Méthode

Edition

Tickets liés :

État de la plateforme

Dans la version 0.7.5.

Element text
  • crée un élement h3 avec @id
  • itère sur ses attributs pour afficher un tableau : nom + valeur
  • saute une ligne
Element head
  • crée un élément h2 avec le contenu de la balise head
Element note
  • crée un span contenant le texte “[*]” en rouge avec un tooltip qui contient le contenu des w/form et du texte hors w
    • le contenu des notes est normalement tokenisé et indexé par le moteur de recherche (mais le retour au texte est impossible à partir de concordances)
    • pour ne pas indexer le contenu des notes, il faut ajouter une ligne “ignoredelements=note” dans le fichier import.properties (cf. Le Manuel de référence TXM)
    • dans ce cas, on peut dupliquer les notes lors de la préparation du corpus et placer les doublons à la fin du document dans <p rend=“note”>
Element graphic
  • si @url est renseigné, crée une balise img dans une balise div et utilise graphic@url pour renseigner img@src
Elements lg, p et q
  • crée un élément p
  • si @rend est renseigné il est utilisé pour remplir p@class
Elements lb et br
  • crée un élément br
Element pb (ou l'élément de pagination indiqué dans import.properties)
  • coupe la page en refermant les balises ouvertes puis en les ré-ouvrant
  • crée un élément p centré dont le texte est affiché en rouge. Le contenu du p est la valeur de l'attribut @n.

Solution

Edition

Proposition 1 : stylage CSS

Proposition 2 : XML + CSS

Recette

Protocole de test

Alpha

Beta

État courant

Qui Quant Quoi

public/import_xml.1384536609.txt.gz · Dernière modification: 2013/11/15 18:30 par slh@ens-lyon.fr