Outils pour utilisateurs

Outils du site


public:chantier_antract

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
public:chantier_antract [2020/01/13 18:08]
slh@ens-lyon.fr [Retour à la vidéo depuis une section d'édition]
public:chantier_antract [2020/08/17 15:22]
matthieu.decorde@ens-lyon.fr [Corpus]
Ligne 65: Ligne 65:
     * [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​antract/​antract_corpus_voixoff#​v02|V0.2]]     * [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​antract/​antract_corpus_voixoff#​v02|V0.2]]
  
-==== TXM ====+=== Outils de préparation des corpus ​===
  
-=== Préparation des corpus ​===+De [[public:​utilitaires:​prototypes|nouveaux utilitaires]] d'​assistance à la préparation de sources de corpus ​ont été développés pour produire le corpus VOIXOFF V0.2.
  
-  * Macro AddSections (corpus AFVOIXOFF V0.2) +Ils sont mis en oeuvre par la procédure ​de construction ci-dessous.
-    * objectif : outils d'​intégration de structures internes dans une transcription synchronisée aux mots près à partir de timecodes situés dans un tableau de métadonnées combinant métadonnées de transcriptions complètes et métadonnées de transcriptions partielles (internes) +
-    * algo +
-      * insère les Turn dans les Sections (sujets timés avec antract_debut et antract_fin) +
-        * si un Turn chevauche ​en partie ​la section, il est quand même inséré dans la section +
-          * rq, il faudrait corriger le Section@startTime et Section@endTime pour pouvoir ré-ouvrir le fichier dans transcriber +
-    * paramètres +
-      * structure (paramètre interne) : Section +
-      * répertoire des fichiers Transcriptions +
-      * fichier ​de metadonnées +
-      * correspondance notice sujet -> notice sommaire : identifiant notice principale +
-      * colonnes d'​identification des sections : +
-        * identifiant de transcription +
-        * temps de début (timecode de type INA) +
-        * temps de fin +
-      * colonne de métadonnées +
-        * attributs à ajouter aux sections+
  
-  * Macro Table2Corpus (corpus ​AFNOTICES V3) +=== Procédure de préparation du corpus ​AFVOIXOFF V0.2 === 
-    objectif ​construire un corpus de notices à partir d'un tableau ​de métadonnées, et éventuellement ​de fichiers texte externes ​(géométrie très nombreux petits fichiers+ 
-      * le tableau ​de métadonnées contient ​+  ​Installer TXM 0.8.1 
-        des métadonnées de textes +  * Récupérer la dernière version des macros depuis les [[http://​forge.cbp.ens-lyon.fr/​redmine/​projects/​txm/​repository/​show/​tmp/​org.txm.groovy.core/​src/​groovy/​org/​txm/​macro/​prototypes/​transcription|sources TXM]] et les copier dans les macros ​de TXM 0.8.1 
-        * des contenus de textes +  * Récupérer le dernier état des métadonnées de notices : "​ANTRACT_AF_Notices_3oct19.xlsx" ​([[https://​sharedocs.huma-num.fr/#/​2139/​7000/​SP2%20Corpus%20&​%20Recherche%20technologique/​Notices%20documentaires/​AF]]
-        * des métadonnées de structures internes +  Créer ​le tableau ​émissions et sujets avec la macro **BuildAFMetadata** 
-        * des contenus ​de structures internes +    * tableFile ​all.xlsx 
-          ou bien les contenus proviennent ​de fichiers externes ​(id.txt ou id.xml)  ​[géométrie très nombreux petits ​fichiers] +    buildSujetsMetadata : true 
-    * réécriture de Excel2XML ??? pour gérer ​les structures internes+    buildEmissionsMetadata : true \\ -> les fichiers "​sujets.xlsx"​ et "​emissions.xlsx"​ sont créés à coté du fichier "​all.xlsx"​ 
 +  * Récupérer le dernier état des sources TRS depuis [[https://​sharedocs.huma-num.fr/#/​2139/​7000/​SP2%20Corpus%20&​%20Recherche%20technologique/​Voix%20Off]] 
 +  Corriger les sources avec la macro **FIXINATRS** 
 +    * trsDirectory : le répertoire ​des fichiers sources \\ -> le résultat est enregistré dans le sous-dossier "​out"​ 
 +  Injecter les sections avec la macro **AddSectionsFromTable** 
 +    * metadataFile : le fichier sujets.xlsx 
 +    * trsDirectory : le répertoire ​des sources 
 +    * joinTRSColumn : Lien notice principale 
 +    * startTimeColumn : antract_debut 
 +    * endTimeColumn : antract_fin 
 +    * typeColumns : Titre propre 
 +    * topicColumns : Date de diffusion 
 +    metadataColumns : Titre propre;​Date ​de diffusion;​Identifiant de la notice;​Notes du titre;Type de date;​Durée;​Genre;​Langue VO / VE;Nature de production;​Producteurs ​(Aff.);​Thématique;​Nom fichier segmenté (info);​antract_video;​antract_debut;​antract_fin;​antract_duree;​antract_tc_type;​antract_tc_date;​Résumé;​Séquences;​Descripteurs (Aff. Lig.);​Générique (Aff. Lig.) 
 +    * metadataColumnsGroups : metadata;​metadata;​metadata;​metadata;​metadata;​metadata;​metadata;​metadata;​metadata;​metadata;​metadata;​secondary;​secondary;​secondary;​secondary;​secondary;​secondary;​secondary;​text;​text;​text;​text \\ -> le résultat est enregistré dans le sous-dossier "​out"​ 
 +  * Préparer un répertoire AFVOIXOFFV2 contenant : 
 +    * les fichiers ​TRS corrigés et sectionnés (sous-sous-répertoire "​out"​) 
 +    * le fichier emissions.xlsx renommé en metadata.xlsx 
 +  * Importer le répertoire avec le module d'​import XML-TRS 
 +  * Une fois importé, régler ​les paramètres MediaPlayer du corpus en copiant dans le répertoire "​.settings"​ du corpus binaire le nouveau fichier ''​CorpusCommandPreferences.prefs''​ contenant les lignes suivantes : <​code>​backtomedia/​backtomedia_endproperty=endtime 
 +backtomedia/​backtomedia_startproperty=starttime 
 +backtomedia/​backtomedia_structure=sp 
 +backtomedia/​backtomedia_time_property=time 
 +backtomedia/​media_auth=true 
 +backtomedia/​media_auth_login= 
 +backtomedia/​media_extension=mp4 
 +backtomedia/​media_path_prefix=https\://​{0}\:​{1}@okapi.ina.fr/​antract/​Media/​AF/​ 
 +backtomedia/​name=backtomedia 
 +backtomedia/​secured_media_login=okapi_reader 
 +backtomedia/​secured_media_path_prefix=https\://​{0}\:​{1}@okapi.ina.fr/​antract/​Media/​AF/​ 
 +backtomedia/​sync_mode=Structure 
 +concordance/​context_limits=text 
 +concordance/​context_limits_type=list 
 +concordance/​name=concordance 
 +eclipse.preferences.version=1</​code>​ 
 + 
 +==== TXM ====
  
 === Retour à la vidéo (extension Media Player) === === Retour à la vidéo (extension Media Player) ===
Ligne 143: Ligne 162:
   * a) [SLH] sous-titre H2 centré = "​(transcription de la voix off)"   * a) [SLH] sous-titre H2 centré = "​(transcription de la voix off)"
     * sous le titre principal     * sous le titre principal
-  * b) ou bien [BP] entête de page H2 centré = "​commentaires parlés"​ ou bien "​transcription voix off"+  * b) ou bien [BP] entête de page H2 centré = "​commentaires parlés"​ ou bien "​transcription voix off"
     * détaché du titre principal     * détaché du titre principal
  
Ligne 275: Ligne 294:
  
 ===== Recette étape 2.2 ===== ===== Recette étape 2.2 =====
 +
 +Si vous souhaitez simplement installer la version courante de TXM pour l'​**utiliser** dans le cadre du projet Antract, la procédure d'​installation est maintenant dans un document propre disponible sur le sharedocs huma-num du projet ici :
 +ANR > ANTRACT > SP2 Corpus & Recherche technologique > TXM > formation_et_aide > fiche_installation
 +
 +Lien direct de téléchargement de la version pdf : [[https://​bit.ly/​2xF35QS|fiche_installation_txm_antract_200507a.pdf]]
 +
 +Les paragraphes qui suivent concernent le cas où vous souhaitez **aider** le projet en testant la nouvelle version et en vérifiant son bon fonctionnement.
  
 ==== Étapes initiales ==== ==== Étapes initiales ====
  
-  * si nécessaire, ​avec une bonne connexion Internet : +  * si nécessaire, ​télécharger et installer ​[[https://txm.gitpages.huma-num.fr/​textometrie/​files/​software/​TXM/​0.8.1beta/|TXM 0.8.1 (actuellement en version beta)]] sur l'​ordinateur ; 
-    * [[http://textometrie.ens-lyon.fr/​files/​software/​TXM/​0.8.0/|installer ​TXM 0.8.0]] sur l'​ordinateur ; +  * installer l'​extension Media Player depuis TXM : 
-  * placer TXM en [[http://​textometrie.ens-lyon.fr/​html/​doc/​manual/​0.7.9/​fr/​manual7.xhtml#​toc40|niveau de mise à jour]] BETA : +    * menu Fichier > Ajouter une extension 
-    * menu Edition > Préférences +    * sélectionner l'​extension Media Player ​(utiliser l'​ascenseur pour parcourir la liste des extensions disponibles), puis accepter les différentes étapes ​(détail : cf. section ​[[https://pages.textometrie.org/txm-manual/installation.html#​sec:​install-extension/installation.html#sec:​install-extension|Installer une extension]] dans le manuel utilisateur ​TXM)
-    * dans les items à gauche de la fenêtre, déplier "​TXM"​ en double-cliquant dessus +
-    * sélectionner (clic simple) "​Avancé"​ +
-    * dans le panneau qui s'​affiche à droite, régler le paramètre "​Niveau de mise à jour" sur "​BETA"​ +
-    * fermer la boîte de dialogue en validant (bouton "Apply and close"​). +
-  * installer l'[[https://​groupes.renater.fr/​wiki/​txm-users/​public/​extensions_beta#​media_player|extension Media Player]] depuis TXM : +
-    * menu Fichier > Ajouter une extensionsélectionner l'​extension Media Player, puis accepter les différentes étapes +
-  * lancer la [[http://​textometrie.ens-lyon.fr/​html/​doc/manual/0.7.9/fr/manual7.xhtml#toc40|mise à jour]] de TXM +
-    * menu Fichier > Vérifier les mises à jour +
-      * tout sélectionner +
-      * accepter les différentes étapes (licence, installer quand même malgré contenu son signé, etc.) +
-    * relancer TXM +
-    * on doit obtenir les versions suivantes (voir Aide > À propos de TXM > Détails de l'​installation > onglet "​Logiciels installés"​) : +
-      * Media Player 1.0.0.201912200929 +
-      * TXM 0.8.0.201912191732 (**attention** il peut-être parfois nécessaire d'​installer une version intermédiaire de TXM avant d'​avoir la dernière version)+
   * télécharger le corpus binaire des transcriptions AFVOIXOFFV02.txm depuis Sharedocs :   * télécharger le corpus binaire des transcriptions AFVOIXOFFV02.txm depuis Sharedocs :
     * chemin : "​ANR/​ANTRACT/​SP2.../​TXM/​Corpus/​Corpus voixoff"​     * chemin : "​ANR/​ANTRACT/​SP2.../​TXM/​Corpus/​Corpus voixoff"​
-    * ou lien de téléchargement : [[https://​sharedocs.huma-num.fr/​wl/?​id=n51zJ5KytPQo3jEiXeTbBP2qfgO0Wgpg]]+    * ou lien de téléchargement : [[https://​sharedocs.huma-num.fr/​wl/?​id=CnrFQJDxWgZ5BJBZM1CSdC3wnQ4Yjpnb]]
   * charger le corpus binaire AFVOIXOFFV02.txm pour obtenir le corpus AFVOIXOFFV02 :   * charger le corpus binaire AFVOIXOFFV02.txm pour obtenir le corpus AFVOIXOFFV02 :
     * menu Fichier > Charger > Un corpus binaire (.txm)...     * menu Fichier > Charger > Un corpus binaire (.txm)...
     * indiquer l'​emplacement sur votre ordinateur du fichier AFVOIXOFFV02.txm que vous avez téléchargé,​ en naviguant jusqu'​à lui,     * indiquer l'​emplacement sur votre ordinateur du fichier AFVOIXOFFV02.txm que vous avez téléchargé,​ en naviguant jusqu'​à lui,
     * puis Valider (bouton en bas de la boîte de dialogue) ;     * puis Valider (bouton en bas de la boîte de dialogue) ;
-    * TXM charge le corpus ​qui apparaît dans la liste des corpus, avec un petit cube marqué "​C",​ dans la partie gauche de la fenêtre TXM (vue Corpus).+    * TXM charge le corpus ​(cela peut prendre une petite minute), puis AFVOIXOFFV02 ​apparaît dans la liste des corpus, avec un petit cube marqué "​C",​ dans la partie gauche de la fenêtre TXM (vue Corpus).
   * sélectionner le corpus AFVOIXOFFV02   * sélectionner le corpus AFVOIXOFFV02
     * vérifier la version avec la commande Propriétés (menu Corpus > Propriétés > onglet "​Général"​)     * vérifier la version avec la commande Propriétés (menu Corpus > Propriétés > onglet "​Général"​)
Ligne 322: Ligne 334:
       * identifiant       * identifiant
       * mot de passe       * mot de passe
-    * cliquer sur 'Se connecter'​\\ **Attention** : dans l'​état actuel du logiciel TXM (au 13/​01/​2020),​ une erreur de saisie de l'​identifiant ou du mot de passe empêche d'​accéder aux vidéos (à juste titre) mais il n'y a aucun retour (visuel, textuel) fait de la situation à l'​utilisateur ni possibilité de ré-essayer de saisir ces informations. Dans cette situation il faut donc relancer TXM pour ré-tenter ​l'​accès aux vidéos. +    * cliquer sur 'Se connecter'​\\ **Attention** : dans l'​état actuel du logiciel TXM (au 13/​01/​2020),​ une erreur de saisie de l'​identifiant ou du mot de passe empêche d'​accéder aux vidéos (à juste titre) mais il n'y a aucun retour (visuel, textuel) fait de la situation à l'​utilisateur ni possibilité de ré-essayer de saisir ces informations. Dans cette situation il faut donc relancer TXM pour retenter ​l'​accès aux vidéos. 
-  * la fenêtre du lecteur vidéo s'​ouvre ​à droite ​de la fenêtre de la transcription :+  * la fenêtre du lecteur vidéo s'​ouvre ​au-dessus ​de la fenêtre de la transcription :
     * Note : il y a une petite latence avant le démarrage de la lecture de la vidéo     * Note : il y a une petite latence avant le démarrage de la lecture de la vidéo
   * vérifier que l'​empan joué correspond bien au début de la transcription de la 3e notice   * vérifier que l'​empan joué correspond bien au début de la transcription de la 3e notice
     * soit, en temps, à 00:03:46:00 qui est la valeur de la propriété '​antract_debut'​ (00 heure 03 minutes 46 secondes)     * soit, en temps, à 00:03:46:00 qui est la valeur de la propriété '​antract_debut'​ (00 heure 03 minutes 46 secondes)
-    * soit, en texte, quand la voix off dit ''​mille Neuf cent quarante cinq. C'est le premier ​dirigeant du de la libération...''​\\ ​ [le texte de la transcription se trouve après la barre de délimitation de la liste des propriétés du sujet]+    * soit, en texte, quand la voix off dit ''​Mille neuf cent quarante-cinq. C'est le premier ​1er janvier ​de la Libération...''​\\ ​ [le texte de la transcription se trouve après la barre de délimitation de la liste des propriétés du sujet]
   * cliquer sur le bouton [Pause] dans le lecteur pour arrêter la lecture   * cliquer sur le bouton [Pause] dans le lecteur pour arrêter la lecture
 +
 +**Retours**
 +
 +  * BP1 : **OK**
  
 ==== Retour à la vidéo depuis une ligne de concordance ==== ==== Retour à la vidéo depuis une ligne de concordance ====
Ligne 338: Ligne 354:
     * menu Edition > Préférences     * menu Edition > Préférences
     * aller dans la page de préférences "TXM > Utilisateur > Édition"​ en double-cliquant successivement sur "​TXM",​ puis "​Utilisateur",​ etc., dans la marge gauche, pour déplier l'​arborescence (Rq. à cause de son initiale accentuée "​É",​ "​Édition"​ est le dernier élément de la liste sous "​Utilisateur"​)     * aller dans la page de préférences "TXM > Utilisateur > Édition"​ en double-cliquant successivement sur "​TXM",​ puis "​Utilisateur",​ etc., dans la marge gauche, pour déplier l'​arborescence (Rq. à cause de son initiale accentuée "​É",​ "​Édition"​ est le dernier élément de la liste sous "​Utilisateur"​)
-    * régler la préférence "new editor position"​ à la valeur "​RIGHT_OF"​+    * régler la préférence "new editor position"​ à la valeur "​RIGHT_OF" ​et valider ("​Apply and close"​).
   * faire un retour au texte en double-cliquant sur la première ligne de la concordance (''​les premiers Gala voici d'​autres visage Brigitte Bardot ,​ Johnson là Des grandes vedettes, elle du tout Paris en''​)   * faire un retour au texte en double-cliquant sur la première ligne de la concordance (''​les premiers Gala voici d'​autres visage Brigitte Bardot ,​ Johnson là Des grandes vedettes, elle du tout Paris en''​)
     * l'​édition s'​ouvre à droite de la concordance     * l'​édition s'​ouvre à droite de la concordance
   * régler la position d'​ouverture de la fenêtre de lecture vidéo à "à droite de la concordance"​   * régler la position d'​ouverture de la fenêtre de lecture vidéo à "à droite de la concordance"​
 +    * menu Edition > Préférences
     * aller dans les préférences "TXM > Utilisateur > MediaPlayer"​     * aller dans les préférences "TXM > Utilisateur > MediaPlayer"​
-    * modifier la valeur de la préférence "​BackToMedia position"​ à la valeur "​RIGHT_OF"​+    * modifier la valeur de la préférence "​BackToMedia position"​ à la valeur "​RIGHT_OF"​,  et valider ("​Apply and close"​).
   * faire un retour à la vidéo depuis la première ligne de la concordance   * faire un retour à la vidéo depuis la première ligne de la concordance
     * menu contextuel de la première ligne (clic droit sur la première ligne) > Jouer le média     * menu contextuel de la première ligne (clic droit sur la première ligne) > Jouer le média
   * la fenêtre de lecture vidéo s'​ouvre à droite de la concordance   * la fenêtre de lecture vidéo s'​ouvre à droite de la concordance
 +    * si besoin on peut cliquer sur les frontières (entre concordance et vidéo, ou entre vidéo et édition de la transcription) pour les déplacer (par ex. si on veut agrandir la place occupée par la vidéo).
   * vérifier que l'​empan joué correspond bien au tour de parole :   * vérifier que l'​empan joué correspond bien au tour de parole :
     * ''​0:​02:​16 ♫ Avec les premiers Gala voici d'​autres visage Brigitte Bardot,''​     * ''​0:​02:​16 ♫ Avec les premiers Gala voici d'​autres visage Brigitte Bardot,''​
 +
 +**Retours**
 +
 +  * BP1 : **OK**
  
 ==== Réglage de l'​empan de lecture vidéo en mots ==== ==== Réglage de l'​empan de lecture vidéo en mots ====
Ligne 373: Ligne 395:
  
 S 14: 0:02:23 ♫ là Des grandes vedettes, elle du tout Paris en smoking écossais André duguay avec] Nadia gray et oui, Jean pierre ou non une distribution</​code>​ S 14: 0:02:23 ♫ là Des grandes vedettes, elle du tout Paris en smoking écossais André duguay avec] Nadia gray et oui, Jean pierre ou non une distribution</​code>​
 +
 +**Retours**
 +
 +  * FM1 : il y a un petit décalage dans les segments de lecture vidéo à cette étape avec les réglages demandés. Le décalage entre la vidéo et la transcription est d’environ 1 seconde, la vidéo commence 1 seconde avant le départ sélectionné et se termine 1 seconde avant la fin de la sélection.
 +    * BP1 : je reproduis le bug (on demande un contexte 12/17 et on obtient un contexte décalé de 3 mots, 15/14).
 +    * MD : création du ticket [[http://​forge.cbp.ens-lyon.fr/​redmine/​issues/​2808|#​2808]]
 +
  
 ==== Retour à la vidéo depuis une sélection de mots de l'​édition ==== ==== Retour à la vidéo depuis une sélection de mots de l'​édition ====
Ligne 388: Ligne 417:
   * vérifier que l'​empan joué correspond bien aux mots sélectionnés   * vérifier que l'​empan joué correspond bien aux mots sélectionnés
   * cliquer sur le bouton [Pause] dans le lecteur pour arrêter la lecture   * cliquer sur le bouton [Pause] dans le lecteur pour arrêter la lecture
 +
 +**Retours**
 +
 +  * BP1 : on observe le même genre de décalage que lors du Réglage de l'​empan de lecture vidéo en mots (section juste précédente).
 +    * le ticket [[http://​forge.cbp.ens-lyon.fr/​redmine/​issues/​2808|#​2808]] a été complété en ce sens.
  
 ==== Édition de sujet non synchronisé ==== ==== Édition de sujet non synchronisé ====
Ligne 402: Ligne 436:
  
 S 48: 0:05:06 ♫ De fait,</​code>​ S 48: 0:05:06 ♫ De fait,</​code>​
 +
 +**Retours**
 +
 +  * BP1 : **OK**
  
public/chantier_antract.txt · Dernière modification: 2020/10/07 13:07 par slh@ens-lyon.fr