Outils pour utilisateurs

Outils du site


public:umr_ihrim_theatre19

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:umr_ihrim_theatre19 [2018/06/07 17:01]
slh@ens-lyon.fr
public:umr_ihrim_theatre19 [2019/09/12 15:21]
slh@ens-lyon.fr [Questions de recherche]
Ligne 1: Ligne 1:
 ====== Théâtre 19 ====== ====== Théâtre 19 ======
  
-Page de suivi du projet Théâtre 19.+Page de suivi de l'​utilisation de TXM pour le projet Théâtre 19.
  
-===== Corpus TXM =====+===== Corpus TXM : historique des versions ​===== 
 + 
 +==== Corpus 1 :  THEATRE19, Aristippe Theorie_de_l_art_du_comédien-1826 ​====
  
 On commence par faire un corpus TXM composé d'un seul document : Aristippe Theorie_de_l_art_du_comédien-1826. On commence par faire un corpus TXM composé d'un seul document : Aristippe Theorie_de_l_art_du_comédien-1826.
  
-Deux corpus TXM ont été réalisé ​:+Deux corpus TXM ont été réalisés pour voir les différences d'​exploitation ​:
   * THEATRE19 : réalisé avec un import Word+CSV   * THEATRE19 : réalisé avec un import Word+CSV
   * THEATRE19TEI : réalisé avec une conversion OxGarage vers la TEI suivie d'un import XTZ+CSV   * THEATRE19TEI : réalisé avec une conversion OxGarage vers la TEI suivie d'un import XTZ+CSV
Ligne 13: Ligne 15:
 Leurs exports binaires sont déposés dans sharedocs huma-num 'Serge Heiden/​Théâtre19/​Corpus/​bin'​. Leurs exports binaires sont déposés dans sharedocs huma-num 'Serge Heiden/​Théâtre19/​Corpus/​bin'​.
  
-Les dossiers ​source ​correspondant ont été enregistrés dans des archives ZIP : +Les dossiers ​sources ​correspondant ont été enregistrés dans des archives ZIP : 
-  * theatre19docx-src.zip ​: réalisé avec un import Word+CSV +  * theatre19docx-src.zip 
-  * theatre19tei-src.zip ​: réalisé avec une conversion OxGarage vers la TEI suivie d'un import XTZ+CSV+  * theatre19tei-src.zip
  
 Ils sont déposés dans Serge Heiden/​Théâtre19/​Corpus/​src. Ils sont déposés dans Serge Heiden/​Théâtre19/​Corpus/​src.
  
-===== Exemples ​de requêtes TXM directes au sein du portail démo =====+==== Corpus 2 : BECQUET2, Encyclopédie ​de l’art dramatique, Paris, chez l’auteur, 1886 ====
  
-Remarque : il faut se connecter au portail **AVANT** de lancer ces calculs (car il est sous contrôle d'​accès).+Encore un seul texte, mais comprenant une édition synoptique mettant côte-à-côte les images de fac-similés de l'​édition de Gallica avec les pages de l'​édition de la TEI de Word pro. 
 +Par exemple la 5ième page : 
 + 
 +{{:​public:​becquet2-synop-facsimile.png?​1000}} 
 + 
 +Pour afficher les images de fac-similés,​ TXM fait appel aux images hébergées dans le serveur IIIF de Gallica (dont la qualité semble meilleure que les images contenues dans le fichier PDF). 
 +Il faut donc être connecté pour que les images puissent s'​afficher. 
 +L'​idée de cette édition synoptique est d'​aider à comparer la source avec le texte encodé de Word pro. 
 + 
 +Avancé également un peu sur la mise en forme de l'​édition de la transcription : 
 +  * formaté en paragraphes les <def> et <​form>​ 
 +  * formaté les notes en pied de page et leur appel en plein texte (perfectible) 
 +  * formaté les vers et groupes de vers (perfectible) 
 +  * testé l'​encodage d'un premier lien hypertexte : la première référence du texte, "Voyez défauts de prononciation.",​ située page 2 (9 ième page de l'​édition) 
 +{{:​public:​becquet2-lien.png}} 
 + 
 +liée à l'​entrée "​Défauts dans la voix et dans la prononciation",​ située page 140. Pour l'​instant l'​ouverture du lien ouvre la page référée dans une nouvelle fenêtre. 
 + 
 +Déposé dans <​code>​davs://​sharedocs.huma-num.fr/​dav.php/​@Shares/​(634)%20IHRIM/​(5640)%20Éditions%20et%20corpus/​Dictionnaires_theatre_19e/​TXM/​Bécquet</​code>​ 
 + 
 +==== Corpus 3 : DICOTHEATREXIXV0,​ 11 textes XML-TEI ==== 
 + 
 +Premier corpus composé de textes TEI : 
 +  * 3 TEI ont été réalisées par MI, les autres par Word Pro 
 +  * les 3 premiers ne disposent pas de sauts de pages (le troisième est une affiche) 
 + 
 +==== Corpus 4 : DICTHE, 8 textes, entrées ACTEUR, DÉBUT, ENGAGEMENT, EXPRESSION, INTERPRÈTE ==== 
 + 
 +=== Objectifs === 
 + 
 +<à faire> 
 + 
 +=== Corpus === 
 + 
 +Corpus déposé dans Sharedocs (@Shares / (634) IHRIM /(5640) Éditions et corpus / Dictionnaires_theatre_19e / TXM) : 
 +  * DICTHE.txm : corpus binaire 
 +  * DICTHE-src.zip : sources du corpus = fichiers TEI + feuilles xsl et css pour l'​import par XTZ : 
 +    * les plans textuels paramétrés dans l'​import XTZ sont : 
 +      * Hors texte : teiHeader 
 +      * Note elements : note 
 + 
 +===== Exemples de requêtes TXM directes dans le corpus THEATRE19 au sein du portail démo ===== 
 + 
 +Voici par ailleurs des adresses de calculs directs sur le corpus dans le portail. 
 + 
 +Remarque : il faut se connecter au portail **AVANT** de lancer ces calculs (car le corpus ​est sous contrôle d'​accès).
  
   * [[http://​portal.textometrie.org/​demo?​command=index&​path=/​THEATRE19TEI&​query=[frlemma=%22corp.*%7Cgest.*%7Cmouv.*%22]|Index de la requête [frlemma="​corp.*|gest.*|mouv.*"​] ]]   * [[http://​portal.textometrie.org/​demo?​command=index&​path=/​THEATRE19TEI&​query=[frlemma=%22corp.*%7Cgest.*%7Cmouv.*%22]|Index de la requête [frlemma="​corp.*|gest.*|mouv.*"​] ]]
Ligne 30: Ligne 77:
  
 **Attention** : des commandes comme Cooccurrence ne fonctionnent pas dans le portail de façon générale. **Attention** : des commandes comme Cooccurrence ne fonctionnent pas dans le portail de façon générale.
 +
 +
 +
 +===== Questions de recherche =====
 +
 +<à faire>
  
public/umr_ihrim_theatre19.txt · Dernière modification: 2019/09/12 15:21 par slh@ens-lyon.fr