Ceci est une ancienne révision du document !
Page de suivi de l'utilisation de TXM pour le projet Théâtre 19.
On commence par faire un corpus TXM composé d'un seul document : Aristippe Theorie_de_l_art_du_comédien-1826.
Deux corpus TXM ont été réalisés pour voir les différences d'exploitation :
Leurs exports binaires sont déposés dans sharedocs huma-num 'Serge Heiden/Théâtre19/Corpus/bin'.
Les dossiers sources correspondant ont été enregistrés dans des archives ZIP :
Ils sont déposés dans Serge Heiden/Théâtre19/Corpus/src.
Encore un seul texte, mais comprenant une édition synoptique mettant côte-à-côte les images de fac-similés de l'édition de Gallica avec les pages de l'édition de la TEI de Word pro. Par exemple la 5ième page :
Pour afficher les images de fac-similés, TXM fait appel aux images hébergées dans le serveur IIIF de Gallica (dont la qualité semble meilleure que les images contenues dans le fichier PDF). Il faut donc être connecté pour que les images puissent s'afficher. L'idée de cette édition synoptique est d'aider à comparer la source avec le texte encodé de Word pro.
Avancé également un peu sur la mise en forme de l'édition de la transcription :
liée à l'entrée “Défauts dans la voix et dans la prononciation”, située page 140. Pour l'instant l'ouverture du lien ouvre la page référée dans une nouvelle fenêtre.
Déposé dans
davs://sharedocs.huma-num.fr/dav.php/@Shares/(634)%20IHRIM/(5640)%20Éditions%20et%20corpus/Dictionnaires_theatre_19e/TXM/Bécquet
Premier corpus composé de textes TEI :
Corpus déposé dans Sharedocs, @Shares /(634) IHRIM /(5640) Éditions et corpus / Dictionnaires_theatre_19e / TXM :
Voici par ailleurs des adresses de calculs directs sur le corpus dans le portail.
Remarque : il faut se connecter au portail AVANT de lancer ces calculs (car le corpus est sous contrôle d'accès).
Attention : des commandes comme Cooccurrence ne fonctionnent pas dans le portail de façon générale.