Ceci est une ancienne révision du document !
Cette page recense et documente les extensions de TXM ainsi que leur niveau de publication (Beta, Stable).
Vous pouvez partager la documentation de vos propres extensions avec la communauté des utilisateurs de TXM dans cette page.
Pour rappel, l'installation d'une extension TXM se fait en appelant la commande “Fichier > Ajouter une extension”. Voir la section Installer une extension dans TXM du manuel pour plus de détails.
Cette extension installe le logiciel TreeTagger sur votre machine.
Lors du redémarrage de TXM, l'extension installe par ailleurs les deux fichiers modèles de langue français et anglais (fr.par et en.par) dans un répertoire de fichiers modèles sauf si elle détecte la présence de réglages TreeTagger dans TXM qui indiquent l'existence d'un répertoire de fichiers modèle déjà utilisé. Dans ce cas elle propose d'utiliser ce répertoire tel quel (c'est-à-dire de réutiliser les fichiers modèles qui s'y trouvent).
Elle automatise et remplace les manipulations à réaliser manuellement dans le Tutoriel d'installation de TreeTagger pour TXM existant. C'est-à-dire que si vous installez cette extension il n'est plus nécessaire de faire les opérations indiquées dans le tutoriel d'installation de TreeTagger (téléchargements, renommages, création de répertoire, paramétrages, etc.).
L'extension n'aide pas encore à installer des fichiers modèles de langue supplémentaires.
Donc pour installer des fichiers modèle supplémentaire il faut continuer à suivre les étapes 4, 5 et 6 du Tutoriel d'installation de TreeTagger pour TXM.
Pour connaître le répertoire stockant les fichiers modèles où déposer les nouveaux fichiers modèle, il suffit d'aller à la page de préférences “TXM > Avancé > TAL > TreeTagger” et de cliquer sur le bouton “Ouvrir le répertoire des fichiers modèles”. L'explorateur de fichiers du système s'ouvrira alors directement dans ce répertoire. Vous n'avez plus qu'à y glisser vos nouveaux fichiers modèles.
Déjà documenté dans la section Annotation avec un modèle Unité-Relation-Schéma (URS) au fil du texte du manuel de TXM.
Toutes les commandes URS utilisent des paramètres communs, renseignés en début de formulaire de paramètres.
La documentation de chaque commande précise, le cas échéant, les paramètres qui lui sont spécifiques.
Toutes les commandes URS s'appliquent à une sélection de corpus, de sous-corpus ou de partition.
Si la sélection est multiple, les commandes produisent un résultat contrastif entre les objets sélectionnés (en tableau, par exemple UnitsIndex) ou bien itèrent sur les objets sélectionnés (par exemple UnitsList).
Dans le cas des partitions, les commandes travaillent sur les sous-corpus correspondant à leurs parties.
Les commandes utilisent des paramètres de sélection d'entités URS généraux :
La sélection sur critères d'entités URS peut s'exprimer par le biais d'un certain nombre de champs dans un formulaire de paramètres ou bien par le biais d'une expression unique utilisant le langage de requête URSQL. Le mécanisme de sélection par requêtes URS, plus concis, remplace petit à petit la sélection par champs.
Une requête permet de sélectionner une entité par son type, par une propriété ou par une valeur de propriété. 1)
Une requête est de la forme « TYPE@PROPRIÉTÉ=VALEUR_DE_PROPRIÉTÉ ».
Chacun des 3 critères, TYPE, PROPRIÉTÉ et VALEUR_DE_PROPRIÉTÉ (identifiants en majuscules), peut être exprimé par une expression régulière.
Si on souhaite ignorer un critère de sélection, on ne le renseigne pas.
Syntaxes disponibles :
Cas particuliers :
Dans la version 1.0 de l'extension « Annotation URS », seuls les Unités et les Schémas sont pris en compte.
Les commandes utilisent des paramètres de désignation de propriétés d'entités URS généraux :
Un premier jeu de macros a été réalisé pour calculer différentes mesures à l'occasion de l'écriture d'un article pour Les chaînes de référence dans les récits brefs en français : Etude diachronique (XIIIe -XVIe s.), Langue française n° 195 (3/2017) (VO, JG, CG, BP). Puis un deuxième jeu de macros a été réalisé pour calculer de nouvelles statistiques et listing d'éléments URS, en croisant notamment en plus les sélections avec les structures textuelles :
Macros spécifiques à la structure d'annotation utilisée par le projet ANR DEMOCRAT (chaînes de co-références de mentions).
L'extension WordCloud ajoute une commande TXM qui construit une représentation graphique d'index sous la forme d'un nuage de mots.
Cette extension installe le package “wordcloud” ainsi que toutes ses dépendances R. Plus de détails sur la page du package wordcloud sur R-cran.
1) Sélectionner un corpus, un Index ou un Lexique dans la vue Corpus.
2) Lancer la commande WordCloud : une nouvelle fenêtre s'ouvre avec un nuage de mots construit avec les paramètres par défaut.
Paramètres
Note : appliquée à un corpus, la commande se basera sur un Index des mots pleins pour les langues FR et EN (en utilisant des requêtes adaptées aux modèles TreeTagger correspondants) et sur un Index total pour les autres langues.
En cas d'échec d'installation automatique des packages “RColorBrewer” ou “wordcloud” dans R, il faut installer soi-même ces packages dans le R utilisé par TXM.
Étape 1 : Lancer R
*Étape 2 : installer le package R 'wordcloud'
install.packages("wordcloud", dependencies=TRUE, repos="http://cran.rstudio.com");
install.packages("RColorBrewer", dependencies=TRUE, repos="http://cran.rstudio.com");
puis ré-exécuter la commande précédente.
install.packages("Rcpp", dependencies=TRUE, repos="http://cran.rstudio.com");
puis ré-exécuter la commande précédente.
Si l'installation de ces packages n'aboutit pas sous Linux ou Mac OS X, vous pouvez tenter la procédure suivante.
a) Vérifier la version de R et la date de livraison de R, première ligne du résultat de la commande suivante, dans un terminal :
R --version
exemple : R version 2.8.1 (2008-12-22)
b) Si wordcloud ne peut pas être installé dans une version de R donnée, essayer de l'installer depuis les sources du package.
b.1) Pour Mac OS X et Windows, suivre les instructions suivantes de préparation de R pour pouvoir installer des packages à partir de leurs sources : http://cran.r-project.org/doc/manuals/R-admin.html#Installing-packages
Pour R 2.14, il faut :
b.2a) Exécuter dans un terminal :
wget http://cran.r-project.org/src/contrib/Archive/wordcloud/wordcloud_1.4.tar.gz sudo R CMD INSTALL wordcloud_1.4.tar.gz
ou bien b.2b)
install.packages("/répertoire/de/téléchargement/wordcloud_1.4.tar.gz")
Pour les autres versions de R, il faut utiliser une version du package wordcloud dont la date de publication est la plus proche possible de la date de livraison du R installé, voir http://cran.r-project.org/src/contrib/Archive/wordcloud
L'extension “Media Player” permet de jouer depuis une concordance TXM un extrait de son ou de vidéo correspondant à l'intégralité du tour de parole (<sp>) d'une transcription où le mot pivot d'une ligne de concordance a été prononcé. Il s'agit donc d'un retour au texte adapté aux corpus multimédia complémentaire au retour au texte classique (de la transcription).
Installer le logiciel VLC : Site officiel de VLC.
Attention : l'extension ne fonctionne pas sous Linux 32bit (bug lié aux scripts Lua de VLC 32bit).
Pour que le plugin fonctionne, il faut :
La procédure de préparation du corpus est donc la suivante :
Pour des raisons de protection de la vie privée (image, voix, nom et prénom, etc.), seule la partie située entre 0h 30m 26s et 0h 31m 39s du cours est visible et audible et la transcription est entièrement anonymisée. Pour faire un retour à la vidéo utile, il faut donc faire une concordance de mots prononcés dans cet intervalle. Par exemple :
P1S8 30 avril 2014, P, 0:30:49 si vous faites taper la lumière d'un néon sur un CD vous ne verrez pas toutes les couleurs de l'
Le retour à l'audio/vidéo est opéré soit :
Dans les deux cas, le passage contenant le pivot de la ligne est joué dans le lecteur multimédia intégré à TXM.
Si le retour à l'audio/Vidéo ne fonctionne pas, un message de diagnostic s'affiche dans la console de TXM.
L'extension permet également de jouer un fichier vidéo ou audio directement dans TXM, indépendamment d'un corpus, avec la commande 'Fichier / Ouvrir media' (utile pour vérifier le bon fonctionnement de VLC).
Interface du lecteur multimedia
A) Répéter la lecture : oui/non
B) La page de préférences du lecteur multimédia propose 2 façons de construire un empan temporel du média à jouer (prototype d'empan) :
Par propriétés de structures
Par défaut, l'empan est construit à partir des propriétés de mot du pivot suivantes :
(ces informations sont associées aux mots automatiquement par le module d'import XML Transcriber +CSV)
Par propriétés de mots
Par défaut, l'empan est construit à partir de la propriété “time” du premier mot du contexte gauche et du dernier mot du contexte droit de la ligne de concordance. C'est donc la taille du contexte de la concordance qui définit la taille de l'empan temporel à jouer.
Cette extension permet d'éditer des fichiers XML avec aide à la lecture et à l'écriture.
Un fichier XML s'ouvre à l'aide de la commande “Open XML file…” du menu fichier.
Documentation complète : http://sourceforge.net/projects/txm/files/documentation/Manuel%20editeur%20XML%20de%20TXM.pdf/download
Cette extension permet d'enregistrer une séquence d'appuis sur les touches du clavier et de la souris et de la rejouer.
Dans un éditeur de texte de TXM.
Enregistrement :
Exécuter la macro enregistrée :
Aucun
Cette extension a été développée dans le cadre du projet ANR Oriflamms http://oriflamms.hypotheses.org. Elle permet de préparer les corpus de transcriptions de manuscrits respectant le format spécifié au traitement par le logiciel Oriflamms (alignement du texte à l'image, classification des formes de caractères) et à l'import dans TXM dans le cadre du module XTZ+CSV. Elle inclut également plusieurs commandes utile à l'analyse paléographique.