Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Dernière révision Les deux révisions suivantes | ||
public:umr_ihrim_theatre19 [2018/06/07 17:01] slh@ens-lyon.fr |
public:umr_ihrim_theatre19 [2019/09/12 15:17] slh@ens-lyon.fr [Corpus 4 : DICTHE, 8 textes, entrées ACTEUR, DÉBUT, ENGAGEMENT, EXPRESSION, INTERPRÈTE] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
====== Théâtre 19 ====== | ====== Théâtre 19 ====== | ||
- | Page de suivi du projet Théâtre 19. | + | Page de suivi de l'utilisation de TXM pour le projet Théâtre 19. |
- | ===== Corpus TXM ===== | + | ===== Corpus TXM : historique des versions ===== |
+ | |||
+ | ==== Corpus 1 : THEATRE19, Aristippe Theorie_de_l_art_du_comédien-1826 ==== | ||
On commence par faire un corpus TXM composé d'un seul document : Aristippe Theorie_de_l_art_du_comédien-1826. | On commence par faire un corpus TXM composé d'un seul document : Aristippe Theorie_de_l_art_du_comédien-1826. | ||
- | Deux corpus TXM ont été réalisé : | + | Deux corpus TXM ont été réalisés pour voir les différences d'exploitation : |
* THEATRE19 : réalisé avec un import Word+CSV | * THEATRE19 : réalisé avec un import Word+CSV | ||
* THEATRE19TEI : réalisé avec une conversion OxGarage vers la TEI suivie d'un import XTZ+CSV | * THEATRE19TEI : réalisé avec une conversion OxGarage vers la TEI suivie d'un import XTZ+CSV | ||
Ligne 14: | Ligne 16: | ||
Les dossiers sources correspondant ont été enregistrés dans des archives ZIP : | Les dossiers sources correspondant ont été enregistrés dans des archives ZIP : | ||
- | * theatre19docx-src.zip : réalisé avec un import Word+CSV | + | * theatre19docx-src.zip |
- | * theatre19tei-src.zip : réalisé avec une conversion OxGarage vers la TEI suivie d'un import XTZ+CSV | + | * theatre19tei-src.zip |
Ils sont déposés dans Serge Heiden/Théâtre19/Corpus/src. | Ils sont déposés dans Serge Heiden/Théâtre19/Corpus/src. | ||
- | ===== Exemples de requêtes TXM directes au sein du portail démo ===== | + | ==== Corpus 2 : BECQUET2, Encyclopédie de l’art dramatique, Paris, chez l’auteur, 1886 ==== |
- | Remarque : il faut se connecter au portail **AVANT** de lancer ces calculs (car il est sous contrôle d'accès). | + | Encore un seul texte, mais comprenant une édition synoptique mettant côte-à-côte les images de fac-similés de l'édition de Gallica avec les pages de l'édition de la TEI de Word pro. |
+ | Par exemple la 5ième page : | ||
+ | |||
+ | {{:public:becquet2-synop-facsimile.png?1000}} | ||
+ | |||
+ | Pour afficher les images de fac-similés, TXM fait appel aux images hébergées dans le serveur IIIF de Gallica (dont la qualité semble meilleure que les images contenues dans le fichier PDF). | ||
+ | Il faut donc être connecté pour que les images puissent s'afficher. | ||
+ | L'idée de cette édition synoptique est d'aider à comparer la source avec le texte encodé de Word pro. | ||
+ | |||
+ | Avancé également un peu sur la mise en forme de l'édition de la transcription : | ||
+ | * formaté en paragraphes les <def> et <form> | ||
+ | * formaté les notes en pied de page et leur appel en plein texte (perfectible) | ||
+ | * formaté les vers et groupes de vers (perfectible) | ||
+ | * testé l'encodage d'un premier lien hypertexte : la première référence du texte, "Voyez défauts de prononciation.", située page 2 (9 ième page de l'édition) | ||
+ | {{:public:becquet2-lien.png}} | ||
+ | |||
+ | liée à l'entrée "Défauts dans la voix et dans la prononciation", située page 140. Pour l'instant l'ouverture du lien ouvre la page référée dans une nouvelle fenêtre. | ||
+ | |||
+ | Déposé dans <code>davs://sharedocs.huma-num.fr/dav.php/@Shares/(634)%20IHRIM/(5640)%20Éditions%20et%20corpus/Dictionnaires_theatre_19e/TXM/Bécquet</code> | ||
+ | |||
+ | ==== Corpus 3 : DICOTHEATREXIXV0, 11 textes XML-TEI ==== | ||
+ | |||
+ | Premier corpus composé de textes TEI : | ||
+ | * 3 TEI ont été réalisées par MI, les autres par Word Pro | ||
+ | * les 3 premiers ne disposent pas de sauts de pages (le troisième est une affiche) | ||
+ | |||
+ | ==== Corpus 4 : DICTHE, 8 textes, entrées ACTEUR, DÉBUT, ENGAGEMENT, EXPRESSION, INTERPRÈTE ==== | ||
+ | |||
+ | === Objectifs === | ||
+ | |||
+ | <à faire> | ||
+ | |||
+ | === Corpus === | ||
+ | |||
+ | Corpus déposé dans Sharedocs (@Shares / (634) IHRIM /(5640) Éditions et corpus / Dictionnaires_theatre_19e / TXM) : | ||
+ | * DICTHE.txm : corpus binaire | ||
+ | * DICTHE-src.zip : sources du corpus = fichiers TEI + feuilles xsl et css pour l'import par XTZ : | ||
+ | * les plans textuels paramétrés dans l'import XTZ sont : | ||
+ | * Hors texte : teiHeader | ||
+ | * Note elements : note | ||
+ | |||
+ | ===== Exemples de requêtes TXM directes dans le corpus THEATRE19 au sein du portail démo ===== | ||
+ | |||
+ | Voici par ailleurs des adresses de calculs directs sur le corpus dans le portail. | ||
+ | |||
+ | Remarque : il faut se connecter au portail **AVANT** de lancer ces calculs (car le corpus est sous contrôle d'accès). | ||
* [[http://portal.textometrie.org/demo?command=index&path=/THEATRE19TEI&query=[frlemma=%22corp.*%7Cgest.*%7Cmouv.*%22]|Index de la requête [frlemma="corp.*|gest.*|mouv.*"] ]] | * [[http://portal.textometrie.org/demo?command=index&path=/THEATRE19TEI&query=[frlemma=%22corp.*%7Cgest.*%7Cmouv.*%22]|Index de la requête [frlemma="corp.*|gest.*|mouv.*"] ]] | ||
Ligne 30: | Ligne 77: | ||
**Attention** : des commandes comme Cooccurrence ne fonctionnent pas dans le portail de façon générale. | **Attention** : des commandes comme Cooccurrence ne fonctionnent pas dans le portail de façon générale. | ||
+ | |||
+ | |||
+ | |||
+ | ===== Questions de recherche ===== | ||
+ | |||