Outils pour utilisateurs

Outils du site


public:import_word_style

Import Word/ODT stylé

Objectif

Mettre en place une chaine d'import Word/ODT stylé (au niveau des paragraphes et des caractères) → XML-TEI → XML-TEI TXM → TXM commune, ouverte, documentée (et maintenue avec la TEI ? avec Métopes ?).

Voir également les spécifications du module d'import ODT/Document.

Solution 1

Intégrer la chaine Métopes.

Le stage de CB a permis de valider un prototype de chaine intégrée permettant d'importer des Word/ODT stylés Métopes dans TXM à partir du module d'import XTZ+CSV avec un bon niveau de transmission des éditions et une gestion des mots correcte et compatible.

Cette chaine est composée des éléments suivants :

  • A
  • B

Pour la valider, on peut récupérer l'archive de composants X et l'archive du corpus de test A.

Pour les utiliser on suit la procédure suivante :

  • étape 1
  • étape 2

La chaine est documentée par les éléments suivants :

  • description générale de la chaine
  • documentation/procédure/tutoriel de stylage dans Word/ODT
  • documentation/procédure/tutoriel du XML-TEI résultants des styles

Chemin de fer (état de la solution)

  • il faut qu'on récupère les composants et le corpus de test du stage de CB
  • il faut valider la gestion des unités textuelles et des unités lexicales tout au long de la chaine
  • il faut préciser les structures internes obtenues/obtenables
  • il faut préciser les possibilités de développement d'un sommaire (voir par exemple la spéc de sommaires au sein des éditions TXM)
  • il faut viser un premier manuel/tutoriel simplifié pour la validation sur un corpus simple

Solution 2

  • lister les différents use cases connus (projet Russe, Métopes, etc.), faire la synthèse
  • mettre à plat les modules d'import ODT+CSV et XTZ+CSV
  • choisir une architecture de passage Word→TEI
  • intégrer l'ensemble

Documentation utilisateur

Documentation développeur

Recettes

Validation avec le manuel de TXM

[à suivre]

Validation avec le corpus Théâtre 19

[à suivre]

public/import_word_style.txt · Dernière modification : 08/06/2018 16:01 de slh@ens-lyon.fr