Projets IFÉ mobilisant TXM

Exposition Libération des camps - Grands entretiens de l'INA

Le projet d'exposition sur la libération des camps à la bibliothèque Diderot de Lyon compte mettre en place un poste utilisant un portail TXM pour explorer un corpus de 112 transcriptions d'entretiens de témoins produit par l'INA (grands entretiens de l'INA).

Une première ébauche de l'interface de ce poste scénarisant des parcours thématiques a été élaborée par (BP, ED, SH) :

Éléments de description plus précis (réunion du 26 février, ED TG SH BP)

Pour la zone de gauche :

Quelques propositions de recherche
  Des mots :
  - mot 1
  - mot 2
  - mot 3
  - ...
  - mot m
  - Votre mot : [zone de saisie] (?)-> texte de l'aide : Vous pouvez saisir ici une simple chaîne de caractères que vous recherchez dans le corpus [BP : ou plutôt : "... un mot que vous recherchez tel quel dans le corpus."]
  Des thèmes :
  - thème 1
  - thème 2
  - ...
  - thème t
  Pour ce genre de recherches plus élaborées il faut se former au langage de requête complet de TXM.

Dans une zone fixe au dessus de la transcription : “Exploration des Grands entretiens de l'INA avec TXM. Vous pouvez retrouver les vidéos correspondant à ces transcriptions sur le site de l'INA.”

Dans une autre zone fixe : “TXM version expo”

On renonce dans l'immédiat à mettre un calcul de cooccurrences, qui supposerait encore des développements supplémentaires (interface pour la version portail).

Logiciel portail TXM

La version portail TXM est la plus appropriée pour répondre à ce besoin :

  • contrôle de l'interface (a priori pas de clavier)
  • contrôle des données exposées et des fonctionnalités
  • rapidité de développement étant donnés les délais
  • possibilité de capitaliser le développement pour d'autres initiatives similaires

Il est donc prévu que le poste soit un client web (Firefox) acccédant à une version du logiciel portail TXM hébergeant le corpus en question, lui-même hébergé dans un Tomcat.

Un nouveau mode de fonctionnement du logiciel portail TXM a commencé à être spécifié par (AL, MD, SH) pour répondre au besoin d'interface spécialisée (simplifiée) : https://groupes.renater.fr/wiki/txm-info/public/interface_expo.

Une nouvelle version du logiciel portail TXM sera développée pour implémenter ce comportement : TXM portal 0.6.2

Hébergement du portail TXM

Il est prévu un hébergement Tomcat du portail TXM dans un serveur de la DSI de l'ENS de Lyon (NC).

Poste client de l'exposition

Le poste “Exploration textométrique d'un corpus de témoignages de rescapés des camps” situé dans l'exposition est un PC ou un Mac connecté au réseau où se situe le serveur hébergeant le logiciel portail TXM hébergeant le corpus.

Ce PC doit disposer d'une souris et d'un clavier.

Il doit exécuter un navigateur en plein écran ouvert sur l'URL d'accès à l'accueil du portail TXM dédié, tout en empêchant de saisir une autre URL.

État d'avancement

Planning prévisionnel

  • 30 mars - 3 avril - étape ALPHA : recette du scénario complet logiciel 0.6.2+corpus sans CQL de thèmes et mots choisis OK
  • 6-10 avril - étape BETA (V1) :
    • recette d'installation de portail TXM 0.6.1 beta dans un serveur DSI de l'ENS de Lyon OK
    • recette du scénario complet logiciel 0.6.2+corpus avec CQL de thèmes et mots choisis dans le portail test OK
  • 13-17 avril - étape STABLE : recette du scénario complet logiciel 0.6.2+corpus avec CQL de thèmes et mots choisis dans le portail DSI OK
  • 20-24 avril - étape PRODUCTION : recette finale sur le poste de l'exposition dans la bibliothèque OK
  • 27 avril 2015 inauguration

État courant

La borne est en production.

* développer les principaux tickets de la 0.6.2 : mode expo * déployer sur le portail test avec le corpus GE * les pages sont présentes avec le contenu de l'exposition : * Home.jsp : contenu du mail de SLH * expo_left_panel.jsp : pas complet, juste 3 requêtes pour tester * chapeau = Exposition : Paroles de libérés

À faire

Développement du logiciel portail

Mise à jour du Corpus (à faire pour le 13-17 avril)

  • retirer les transcriptions des témoins
    1. Claire Andrieu (historienne)
    2. Annette Wieviorka (historienne)
    3. Pierre Truche (procureur)
    4. Robert Badinter (pour raisons de droits)
  • régler le fichier 'metadata.csv' pour déclarer les journalistes pour chaque transcription
  • ne pas indexer les propos des journalistes (on les voit dans l'édition, mais les occurrences ne sont cherchées et comptées que dans les propos des témoins) (suggestion BP, avalisée par ED 20/04)

Réglages des fichiers de configuration du portail (à faire pour le 13-17 avril)

  • panneau de gauche (expo_left_panel.jsp) :
    • intégrer les mots et requêtes définitifs dans la page
      • fournir les mots et requêtes souhaités définitifs
    • ajouter des exemples de flyovers ou de commentaires explicatifs pour des requêtes
  • page d'accueil (Home.jsp) :
    • finalisation de l'habillage graphique
      • homogénéiser la couleur de l'icone AIDE avec celle de l'icone ACCUEIL (bleu pétrole clair, voire canard)
      • utiliser l'image haute définition du graphiste
        • dans le bandeau supérieur
        • dans le paneau latéral gauche
    • finaliser le contenu du texte :
      • améliorer les instructions
      • choisir les logos à mettre en bas
      • màj de la description du corpus ”…interviewés entre 2005 et 2006. 9 à 27 ans…”
      • liste exacte des témoins (?)
      • texte d'annonce de l'enregistrement des statistiques d'activité du portail
  • page d'aide (Help_expo.jsp) :
    • mettre à jour : une capture d'écran ou autre chose (?)

Enregistrement des activités (à faire pour le 13-17 avril)

  • décider si on annonce l'enregistrement des activités ou pas
  • l'activité est enregistrée par défaut : décider si on veut supprimer cet enregistrement par défaut

Borne de l'exposition

La borne de l'exposition a les caractéristiques suivantes :

  • c'est un pupitre intégrant un écran de PC, un clavier et une souris pour la lecture en posture debout
  • l'écran est situé à environ 30 centimètres du lecteur, il fait 19” et a une résolution de 1280×1024
  • le navigateur web utilisé pour accéder au portail TXM est Google Chrome
  • la page du portail doit être visualisée en plein écran, avec un zoom de 150%, le zoom doit être verrouillé
  • on peut fixer un présentoire de brochures TXM sur la façade de la borne. OK (SLH : collé le présentoire de ma porte de bureau avec ~20 brochures FR et ~10 brochures EN)

Problèmes observés in situ sur la borne vendredi 24/04 matin :

  • les flèches de l'aide ne sont pas affichées
  • 'ici' n'est pas affiché dans l'aide
  • il faut désactiver le clic droit, notamment pour empêcher l'impression ou le blocage de la borne
  • il faut désactiver les touches F1, F3 et F5 qui peuvent bloquer la borne
  • il faut réduire la taille globale de la fenêtre car il y a des ascenceurs horizontal et vertical actuellement
  • champ de saisie : 'Saisir un mot à chercher' → 'Saisir un mot' OK (MD)

Analyse de discours antiracistes

Journal Droit de vivre

Objectifs

  • éditoriaux d'un seul auteur
  • évolution chronologique
    • représentations / notions évoquées
      • analyse lexicale

Corpus

État
  • mensuel puis hebdo
  • numéros numérisés image.
  • la partie concernant le projet est transcrite

Texte brut

  • encoder des informations nécessaires à l'étude
    • date (nécessaire)
    • numéro
    • mots incertains
    • délimiter certains éléments hors texte :
      • encadrés
      • séparateurs O O O
      • etc.
    • notes
    • censure
      • marqueur de la position de chaque censure
      • information sur la taille (estimation du nombre de lignes, nombre de mots…)
      • type de marquage : petits points pas utiles
  • conventions de formatage pour obtenir l'encodage et transformer en XML

Opérations

  • établir des conventions



Retour à la liste des projets.

public/ife_memoires.txt · Dernière modification: 2015/10/07 11:39 par slh@ens-lyon.fr