Ceci est une ancienne révision du document !


Documentation des Extensions

Cette page recense la documentation des extensions de TXM. Vous pouvez partager la documentation de vos propres extensions avec la communauté des utilisateurs de TXM dans cette page.

Visualisation de données

WordCloud

L'extension WordCloud ajoute une commande TXM qui construit une représentation graphique d'index sous la forme d'un nuage de mots.

Installation

En cas d'échec d'installation automatique des packages “RColorBrewer” ou “wordcloud” dans R, il faut installer soi-même ces packages dans le R utilisé par TXM.

Étape 1 : Lancer R

  • Sous Windows, lancer le logiciel “C:\Program Files\TXM\R\bin\R.exe” (remplacer “C:\Program Files\” par le chemin exact du dossier d'installation de TXM si ce n'est pas le chemin d'installation par défaut) ;
  • Sous Linux et Mac OS X lancer le R du système dans un terminal.

*Étape 2 : installer le package R 'wordcloud'

  • exécuter la commande
    install.packages("wordcloud", dependencies=TRUE, repos="http://cran.rstudio.com");
  • Si R n'arrive pas à résoudre la dépendance au package “RColorBrewer”, alors il faut exécuter la commande supplémentaire
    install.packages("RColorBrewer", dependencies=TRUE, repos="http://cran.rstudio.com");
    puis ré-exécuter la commande précédente.
  • Si R n'arrive pas à résoudre la dépendance au package “Rcpp”, alors il faut exécuter la commande supplémentaire
    install.packages("Rcpp", dependencies=TRUE, repos="http://cran.rstudio.com");
    puis ré-exécuter la commande précédente.

Si l'installation de ces packages n'aboutit pas sous Linux ou Mac OS X, vous pouvez tenter la procédure suivante.

a) Vérifier la version de R et la date de livraison de R, première ligne du résultat de la commande suivante, dans un terminal :

R --version
exemple : R version 2.8.1 (2008-12-22)

b) Si wordcloud ne peut pas être installé dans une version de R donnée, essayer de l'installer depuis les sources du package.

b.1) Pour Mac OS X et Windows, suivre les instructions suivantes de préparation de R pour pouvoir installer des packages à partir de leurs sources : http://cran.r-project.org/doc/manuals/R-admin.html#Installing-packages

Pour R 2.14, il faut :

b.2a) Exécuter dans un terminal :

wget http://cran.r-project.org/src/contrib/Archive/wordcloud/wordcloud_1.4.tar.gz
sudo R CMD INSTALL wordcloud_1.4.tar.gz
ou bien b.2b)

install.packages("/répertoire/de/téléchargement/wordcloud_1.4.tar.gz")

Pour les autres versions de R, il faut utiliser une version du package wordcloud dont la date de publication est la plus proche possible de la date de livraison du R installé, voir http://cran.r-project.org/src/contrib/Archive/wordcloud

Utilisation

1) Sélectionner un corpus, un Index ou un Lexique dans la vue Corpus.

2) Lancer la commande WordCloud : une nouvelle fenêtre s'ouvre avec un nuage de mots construit avec les paramètres par défaut.

Paramètres

  • N words : Nombre de mots à afficher dans le nuage
  • Fmin : Fréquence minimale des mots pris en compte
  • % of rotated labels: Pourcentage des mots orientés à 90°
  • Randomize : le placement des mots sera aléatoire (non par défaut)

Note : appliquée à un corpus, la commande se basera sur un Index des mots pleins pour les langues FR et EN (en utilisant des requêtes adaptées aux modèles TreeTagger correspondants) et sur un Index total pour les autres langues.

Multimédia

Media Player

Avertissement : extension de niveau ALPHA

L'extension “Media Player” permet de jouer depuis une concordance TXM un extrait de son ou de vidéo correspondant à l'intégralité du tour de parole (<sp>) d'une transcription où le mot pivot d'une ligne de concordance a été prononcé. Il s'agit donc d'un retour au texte adapté aux corpus multimédia complémentaire au retour au texte classique (de la transcription).

Installation

Installer le logiciel VLC : Site officiel de VLC.

Attention : l'extension ne fonctionne pas sous Linux 32bit (bug lié aux scripts Lua de VLC 32bit).

Installer l'extension dans TXM par le menu 'Fichier / Ajouter une extension'.

Utilisation

Préparation du corpus

Pour que le plugin fonctionne, il faut :

  • A) que le corpus de transcriptions ai été importé avec le module d'import 'XML Transcriber +CSV'
  • B) que les fichiers d'enregistrement audio ou vidéo correspondant à chaque transcription soient déposés dans le répertoire 'media' du corpus binaire

La procédure de préparation du corpus est donc la suivante :

  1. importer le corpus (par exemple 'moncorpus') avec le module d'import 'XML Transcriber +CSV'
    L'import crée le dossier <DOSSIER UTILISATEUR>/corpora/moncorpus
  2. créer un dossier 'media' dans le répertoire du corpus binaire (par exemple : <DOSSIER UTILISATEUR>/TXM/corpora/moncorpus/media)
  3. copier les fichiers audio ou vidéo dans le dossier 'media'
    • les fichiers audio/vidéo supportés sont : mp3, wav, mp4, avi (la liste évolue selon les développements de VLC et l'intégration dans TXM). L'extension des fichiers média doit être en minuscule.
    • il doit y avoir un fichier audio ou vidéo par transcription. Par exemple, si un corpus est composé de trois transcriptions nommées 'trans1.trs', 'trans2.trs' et 'trans3.trs' alors il faut copier dans le répertoire 'media' trois fichiers audio nommés 'trans1.mp3', 'trans2.mp3' et 'trans3.mp3'.
Lecture de la vidéo ou de l'audio

Le retour à l'audio/vidéo est opéré soit :

  • depuis le menu contextuel d'une ligne de concordance (clic droit) avec la commande “Play the media”
  • en sélectionnant une ligne de concordance et en tapant le raccourcis clavier 'CTRL - SHIFT - M'

Dans les deux cas, le passage contenant le pivot de la ligne est joué dans le lecteur multimédia intégré à TXM.

Si le retour à l'audio/Vidéo ne fonctionne pas, un message de diagnostic s'affiche dans la console de TXM.

L'extension permet également de jouer un fichier vidéo ou audio directement dans TXM, indépendamment d'un corpus, avec la commande 'Fichier / Ouvrir media'.

Interface du lecteur multimedia

[PAUSE] 08:63 [ \/ \/ \/ ] Répéter [] Taux —-\/– Vol ——-\/-

  • Pause : suspendre la lecture / reprendre la lecture
  • 08:63 : moment de la lecture (minutes:secondes)
  • [ \/ \/ \/ ] : curseurs de lecture (début de l'empan joué, moment de la lecture, fin de l'empan joué)
  • Répéter [] : reprendre la lecture à la fin de l'empan
  • Taux : vitesse de lecture
  • Vol : volume de lecture

Préférences

A) Répéter la lecture : oui/non

B) La page de préférences du lecteur multimédia propose 2 façons de construire un empan temporel du média à jouer (prototype d'empan) :

  • par propriétés de structures
  • par propriétés de mots

Par propriétés de structures

Par défaut, l'empan est construit à partir des propriétés de mot du pivot suivantes :

  • borne de départ : sp_starttime
  • borne de fin : sp_endtime

(ces informations sont associées aux mots automatiquement par le module d'import XML Transcriber +CSV)

Par propriétés de mots

Par défaut, l'empan est construit à partir de la propriété “time” du premier mot du contexte gauche et du dernier mot du contexte droit de la ligne de concordance. C'est donc la taille du contexte de la concordance qui définit la taille de l'empan temporel à jouer.

Import

Environnement SVN

Cette extension est au niveau Alpha

Utilisation

Créer un repository local
  • Ouvrir la vue “Référentiel SVN” : à partir du menu “Affichage > Vues > Autres”, sélectionner “SVN” puis “Référentiel SVN”
  • Dans la nouvelle vue, faire clic droit et sélectionner “Nouveau > Repository…”
  • Une boite de dialogue s'ouvre
  • Indiquer le chemin local où le répository doit être créé
  • Bouton “OK”
Se connecter à un repository SVN
  • La première étape consiste à configurer le repository SVN
    • Ouvrir la vue “Explorateur de projet : à partir du menu “Affichage > Vues > Autres”, sélectionner “Général” puis “Explorateur de projet”
    • Dans la vue “Explorateur de projet”, faire clic droit et sélectionner “Nouveau > Projet…”
    • Dans la boite de dialogue ouverte, sélectionner “SVN > Projet depuis SVN”
    • Indiquer dans le champ “URL” la localisation URL du repository SVN (local: file: ou distant http:)
    • Bouton “Suivant”
    • Bouton “Terminer”
  • La fenêtre suivante sers à configurer le projet, faire “Terminer”
    • Si le repository ne contient pas de projet, il faut le configurer sinon c'est fini.
    • une nouvelle fenêtre à du s'ouvrir
    • Choisir le type de projet “General > Projet”
    • Bouton “Suivant”
    • Nommer le projet
    • Bouton “Terminer”

Éditeurs

XMLEditor

Cette extension permet d'éditer des fichiers XML avec aide à la lecture et à l'écriture.

Utilisation

Un fichier XML s'ouvre à l'aide de la commande “Open XML file…” du menu fichier.

Documentation complète : http://sourceforge.net/projects/txm/files/documentation/Manuel%20editeur%20XML%20de%20TXM.pdf/download

Synoptic Editor

Cette extension permet de visionner des éditions synoptics tels que celle du corpus GRAAL du portail BFM

Utilisation

Ouvrir plusieurs éditions
  • Sélectionner un corpus
  • Lancer la commande “Édition 2” (en : “Open edition 2”)
  • (Une fenêtre de dialogue propose les éditions disponible et pré-sélectionne l'édition par défaut)
  • L'éditeur s'ouvre
    • On navigue dans les pages et textes comme dans l'éditeur d'édition de TXM
    • A gauche, s'affiche la liste des éditions ouvertes
    • A droite, le bouton “Éditions” permet de sélectionner les éditions à afficher
Retour au texte
  • Faire une concordance
  • Dans le menu contextuelle de la concordance, sélectionner “Afficher en plein texte 2” (en : “Display in full text 2”)
  • L'éditeur s'ouvre
  • Pour obtenir un retour au texte synoptique, il faut choisir les éditions à afficher puis refaire un retour au texte

PracticallyMacro

Cette extension permet d'enregistrer une séquence d'appuis sur les touches du clavier et de la souris et de la rejouer.

Utilisation

Dans un éditeur de texte de TXM.

Enregistrement :

  1. lancer l'enregistrement :
    • avec le bouton d'enregistrement “rond violet” de la barre d'outils
    • ou avec le raccourcis clavier Ctrl-Alt-R
  2. taper du texte et utiliser des raccourcis clavier (déplacer le curseur, copier/coller, etc.)
  3. stopper l'enregistrement avec le même bouton “rond violet”

Exécuter la macro enregistrée :

  • avec le bouton de lecture “flèche bleue” de la barre d'outils
  • ou avec le raccourcis clavier Ctrl-Alt-P

Paramètres

Aucun

Prototypes

QueryIndex

L'extension “QueryIndex” est un prototype d'exploitation de listes de CQL.

Aujourd'hui la commande Index dénombre les projections sur une ou plusieurs propriétés de mots des réalisations d'une requête CQL. La commande QueryIndex dénombre les réalisations d'une liste de requêtes CQL. Ce prototype doit nous aider à travailler sur l'intégration de ces deux comportements au sein de TXM, pour le calcul d'Index ou Cooccurrences, etc.

Utilisation

La commande se lance soit sur un Corpus soit sur une Partition sélectionnée dans la vue Corpus.

La commande ouvre alors un éditeur composé de 4 zones :

  1. une zone de formulaire pour ajouter des requêtes CQL. Elle est composée de :
    • un champ “Name” pour nommer la requête dans le tableau de résultats. Ce champ n'est pas obligatoire, si il est vide le nom de la requête sera la requête.
    • un champ “Requête” pour rentrer la requête
    • un bouton pour ajouter plusieurs requêtes d'un coup à l'aide d'un fichier ”.properties”
    • un bouton “Chercher” pour démarrer le calcul de la requête.
  2. une zone de navigation dans les résultats qui comprend :
    • un champ pour choisir le nombre de résultats à afficher par page
    • les boutons pour aller à la première, précédence, suivante ou dernière page de résultat
  3. une zone d'information sur le nombre de résultats obtenu
  4. une zone de résultat qui affiche une ligne par CQL entrée

Pour rentrer plus rapidement plusieurs requêtes CQL, il suffit de taper une requête sans remplir le champ du nom et de valider avec la touche “Entrée”. La CQL est ajoutée aux résultats et le curseur reste dans le champ de la requête, ainsi on peut taper directement la requête suivante.

CQL2LSA

Extension produisant les données nécessaires au calcul LSA de la bibliothèque Topic Modeling Toolbox 1.4 de Matlab.

Voir Projet PG.

public/extensions.1414418809.txt.gz · Dernière modification: 2014/10/27 15:06 par slh@ens-lyon.fr