Outils pour utilisateurs

Outils du site


public:umr_ihrim_theatre19

Théâtre 19

Page de suivi de l'utilisation de TXM pour le projet Théâtre 19.

Corpus TXM : historique des versions

Corpus 1 : THEATRE19, Aristippe Theorie_de_l_art_du_comédien-1826

On commence par faire un corpus TXM composé d'un seul document : Aristippe Theorie_de_l_art_du_comédien-1826.

Deux corpus TXM ont été réalisés pour voir les différences d'exploitation :

  • THEATRE19 : réalisé avec un import Word+CSV
  • THEATRE19TEI : réalisé avec une conversion OxGarage vers la TEI suivie d'un import XTZ+CSV

Leurs exports binaires sont déposés dans sharedocs huma-num 'Serge Heiden/Théâtre19/Corpus/bin'.

Les dossiers sources correspondant ont été enregistrés dans des archives ZIP :

  • theatre19docx-src.zip
  • theatre19tei-src.zip

Ils sont déposés dans Serge Heiden/Théâtre19/Corpus/src.

Corpus 2 : BECQUET2, Encyclopédie de l’art dramatique, Paris, chez l’auteur, 1886

Encore un seul texte, mais comprenant une édition synoptique mettant côte-à-côte les images de fac-similés de l'édition de Gallica avec les pages de l'édition de la TEI de Word pro. Par exemple la 5ième page :

Pour afficher les images de fac-similés, TXM fait appel aux images hébergées dans le serveur IIIF de Gallica (dont la qualité semble meilleure que les images contenues dans le fichier PDF). Il faut donc être connecté pour que les images puissent s'afficher. L'idée de cette édition synoptique est d'aider à comparer la source avec le texte encodé de Word pro.

Avancé également un peu sur la mise en forme de l'édition de la transcription :

  • formaté en paragraphes les <def> et <form>
  • formaté les notes en pied de page et leur appel en plein texte (perfectible)
  • formaté les vers et groupes de vers (perfectible)
  • testé l'encodage d'un premier lien hypertexte : la première référence du texte, “Voyez défauts de prononciation.”, située page 2 (9 ième page de l'édition)

liée à l'entrée “Défauts dans la voix et dans la prononciation”, située page 140. Pour l'instant l'ouverture du lien ouvre la page référée dans une nouvelle fenêtre.

Déposé dans

davs://sharedocs.huma-num.fr/dav.php/@Shares/(634)%20IHRIM/(5640)%20Éditions%20et%20corpus/Dictionnaires_theatre_19e/TXM/Bécquet

Corpus 3 : DICOTHEATREXIXV0, 11 textes XML-TEI

Premier corpus composé de textes TEI :

  • 3 TEI ont été réalisées par MI, les autres par Word Pro
  • les 3 premiers ne disposent pas de sauts de pages (le troisième est une affiche)

Exemples de requêtes TXM directes dans le corpus THEATRE19 au sein du portail démo

Voici par ailleurs des adresses de calculs directs sur le corpus dans le portail.

Remarque : il faut se connecter au portail AVANT de lancer ces calculs (car le corpus est sous contrôle d'accès).

Attention : des commandes comme Cooccurrence ne fonctionnent pas dans le portail de façon générale.

Questions de recherche

public/umr_ihrim_theatre19.txt · Dernière modification: 2019/05/06 13:04 par slh@ens-lyon.fr