Ceci est une ancienne révision du document !
Cette page recense la documentation des extensions de TXM ainsi que leur niveau de publication (Alpha, Beta, Stable).
Vous pouvez partager la documentation de vos propres extensions avec la communauté des utilisateurs de TXM dans cette page.
L'extension WordCloud ajoute une commande TXM qui construit une représentation graphique d'index sous la forme d'un nuage de mots.
En cas d'échec d'installation automatique des packages “RColorBrewer” ou “wordcloud” dans R, il faut installer soi-même ces packages dans le R utilisé par TXM.
Étape 1 : Lancer R
*Étape 2 : installer le package R 'wordcloud'
install.packages("wordcloud", dependencies=TRUE, repos="http://cran.rstudio.com");
install.packages("RColorBrewer", dependencies=TRUE, repos="http://cran.rstudio.com");
puis ré-exécuter la commande précédente.
install.packages("Rcpp", dependencies=TRUE, repos="http://cran.rstudio.com");
puis ré-exécuter la commande précédente.
Si l'installation de ces packages n'aboutit pas sous Linux ou Mac OS X, vous pouvez tenter la procédure suivante.
a) Vérifier la version de R et la date de livraison de R, première ligne du résultat de la commande suivante, dans un terminal :
R --version
exemple : R version 2.8.1 (2008-12-22)
b) Si wordcloud ne peut pas être installé dans une version de R donnée, essayer de l'installer depuis les sources du package.
b.1) Pour Mac OS X et Windows, suivre les instructions suivantes de préparation de R pour pouvoir installer des packages à partir de leurs sources : http://cran.r-project.org/doc/manuals/R-admin.html#Installing-packages
Pour R 2.14, il faut :
b.2a) Exécuter dans un terminal :
wget http://cran.r-project.org/src/contrib/Archive/wordcloud/wordcloud_1.4.tar.gz sudo R CMD INSTALL wordcloud_1.4.tar.gz
ou bien b.2b)
install.packages("/répertoire/de/téléchargement/wordcloud_1.4.tar.gz")
Pour les autres versions de R, il faut utiliser une version du package wordcloud dont la date de publication est la plus proche possible de la date de livraison du R installé, voir http://cran.r-project.org/src/contrib/Archive/wordcloud
1) Sélectionner un corpus, un Index ou un Lexique dans la vue Corpus.
2) Lancer la commande WordCloud : une nouvelle fenêtre s'ouvre avec un nuage de mots construit avec les paramètres par défaut.
Paramètres
Note : appliquée à un corpus, la commande se basera sur un Index des mots pleins pour les langues FR et EN (en utilisant des requêtes adaptées aux modèles TreeTagger correspondants) et sur un Index total pour les autres langues.
Avertissement : extension de niveau ALPHA
L'extension “Media Player” permet de jouer depuis une concordance TXM un extrait de son ou de vidéo correspondant à l'intégralité du tour de parole (<sp>) d'une transcription où le mot pivot d'une ligne de concordance a été prononcé. Il s'agit donc d'un retour au texte adapté aux corpus multimédia complémentaire au retour au texte classique (de la transcription).
Installer le logiciel VLC : Site officiel de VLC.
Attention : l'extension ne fonctionne pas sous Linux 32bit (bug lié aux scripts Lua de VLC 32bit).
Installer l'extension dans TXM par le menu 'Fichier / Ajouter une extension'.
Pour que le plugin fonctionne, il faut :
La procédure de préparation du corpus est donc la suivante :
Le retour à l'audio/vidéo est opéré soit :
Dans les deux cas, le passage contenant le pivot de la ligne est joué dans le lecteur multimédia intégré à TXM.
Si le retour à l'audio/Vidéo ne fonctionne pas, un message de diagnostic s'affiche dans la console de TXM.
L'extension permet également de jouer un fichier vidéo ou audio directement dans TXM, indépendamment d'un corpus, avec la commande 'Fichier / Ouvrir media'.
Interface du lecteur multimedia
[PAUSE] 08:63 [ \/ \/ \/ ] Répéter [] Taux —-\/– Vol ——-\/-
A) Répéter la lecture : oui/non
B) La page de préférences du lecteur multimédia propose 2 façons de construire un empan temporel du média à jouer (prototype d'empan) :
Par propriétés de structures
Par défaut, l'empan est construit à partir des propriétés de mot du pivot suivantes :
(ces informations sont associées aux mots automatiquement par le module d'import XML Transcriber +CSV)
Par propriétés de mots
Par défaut, l'empan est construit à partir de la propriété “time” du premier mot du contexte gauche et du dernier mot du contexte droit de la ligne de concordance. C'est donc la taille du contexte de la concordance qui définit la taille de l'empan temporel à jouer.
Cette extension permet d'éditer des fichiers XML avec aide à la lecture et à l'écriture.
Un fichier XML s'ouvre à l'aide de la commande “Open XML file…” du menu fichier.
Documentation complète : http://sourceforge.net/projects/txm/files/documentation/Manuel%20editeur%20XML%20de%20TXM.pdf/download
Cette extension permet de visionner des éditions synoptiques tels que celle du corpus GRAAL du portail BFM
Cette extension permet d'enregistrer une séquence d'appuis sur les touches du clavier et de la souris et de la rejouer.
Dans un éditeur de texte de TXM.
Enregistrement :
Exécuter la macro enregistrée :
Aucun
L'extension “QueryIndex” est un prototype d'exploitation de listes de CQL.
Aujourd'hui la commande Index dénombre les projections sur une ou plusieurs propriétés de mots des réalisations d'une requête CQL. La commande QueryIndex dénombre les réalisations d'une liste de requêtes CQL. Ce prototype doit nous aider à travailler sur l'intégration de ces deux comportements au sein de TXM, pour le calcul d'Index ou Cooccurrences, etc.
La commande se lance soit sur un Corpus soit sur une Partition sélectionnée dans la vue Corpus.
La commande ouvre alors un éditeur composé de 4 zones :
Pour rentrer plus rapidement plusieurs requêtes CQL, il suffit de taper une requête sans remplir le champ du nom et de valider avec la touche “Entrée”. La CQL est ajoutée aux résultats et le curseur reste dans le champ de la requête, ainsi on peut taper directement la requête suivante.
Extension prototype produisant les données nécessaires au calcul LSA de la bibliothèque Topic Modeling Toolbox 1.4 de Matlab.
Voir Projet PG.
Extension prototype testant d'autres façons de calculer des cooccurrences dans TXM :
nom=cql nom2=cql2
Les deux commandes produisent une matrice qui peut :
Extension permettant de tester l'ensemble des fonctionnalités de la Toolbox à l'aide de deux commandes dans le menu “Aide” :
Pour fonctionner cette extension a besoin du corpus d'exemple BROWN : http://sourceforge.net/projects/txm/files/corpora/brown/