Outils pour utilisateurs

Outils du site


public:import_xml

Spécification du futur module d'import XML/w+CSV

Objectif

Abaissement du niveau sémantique de l'actuel import XML/W (0.7.6) et transférer une partie du sémantisme dans le module XTZ.

Pour chacune des de étapes du modules des réductions sont à opérer.

Importer

Front XSL optionnelle

Validation du formatage XML

Les balises réservées sont :

  • text
    • les attributs sont conservés et utilisés comme metadonnées
    • si est présent un fichier metadata.csv, alors ces attributs peuvent être écrasés.
    • si le premier élément du texte est “text” il est utilisé
  • w
    • les attributs sont conservés et utilisés comme propriété de mot dans les sous-éléments txm:ana
    • le contenu est utilisé pour créer le sous élément txm:form

Le tokenizer XML Simple est appliqué

Annotate

Annotation optionnelle des mots avec [lang]lemma et [lang]pos.

Compiler

Tous les éléments contenu par l'élément “text” (inclus) sont transmit au fichier WTC.

Les éléments w sont transformés en ligne tabulée.

Édition

Gérer un minimum de formatage :

  • afficher les métadonnée de texte
  • transmettre les éléments p
  • générer des tooltips pour les propriétés de mots

Méthode

Édition

Tickets liés :

Solution

Recette

Protocole de test

Alpha

Beta

État courant

public/import_xml.txt · Dernière modification: 2016/06/22 07:45 par matthieu.decorde@ens-lyon.fr