Table des matières

Documentation des Macros de TXM

Les macros sont de petits utilitaires satellites de TXM échangeables et adaptables, ou bien des prototypes de futures fonctionnalités de TXM en cours de discussion et de finalisation, écrits en langage Groovy1). Ce sont des petits fichiers texte d'extension '.groovy' pouvant être édités et modifiés à tout instant avant leur exécution avec n'importe quel éditeur de texte, y compris l'éditeur de texte intégré de TXM (accès direct par la commande 'Éditer' du menu contextuel de chaque macro dans la vue Macro). Des scripts Groovy utilitaires arrivant à maturité sont régulièrement transformés en macros de TXM. Et des macros arrivant à maturité sont régulièrement intégrées sous forme de commandes de base dans TXM.

Les macros utilisent un protocole simple pour ouvrir une boite de dialogue de saisie de leurs paramètres au lancement. Elles sont appelées depuis la vue 'Macro'.

Cette page documente les macros livrées avec TXM. Les versions les plus récentes de ces macros sont téléchargeables directement depuis Sourceforge : http://sourceforge.net/projects/txm/files/software/TXM%20macros

Vous pouvez partager vos propres macros et leur documentation avec la communauté des utilisateurs de TXM par le biais de cette page (vous devez être inscrit à la liste de diffusion 'txm-users' pour cela).

Annotation de corpus

BuildWordPropTable, InjectWordPropTable

Macros d'assistance à la correction ou à l'ajout de propriétés de mots.

Utilisation

Voir le tutoriel de correction de mots.

Préparation des fichiers sources d'un corpus (Source Workbench)

ChangeEncoding

Traitement par lot de conversion d'encodage de caractères pour tous les fichiers d'un dossier.

Paramètres

CharList

Dénombre tous les caractères d'un fichier Unicode UTF-8.

Paramètres

RenameFiles

Renomme tous les fichiers d'un répertoire ayant une certaine extension par chercher/remplacer dans leur nom. Cette macro repose sur l'utilisation du chercher/remplacer d'expression régulière de caractères avec reprise.

Paramètres

Exemple 1 : pour renommer des fichiers nommés 'document 1.txt', 'document 2.txt', 'document 3.txt' en 'texte001.txt', 'texte002.txt', 'texte003.txt' on utilise les paramètres suivants :

Exemple 2 : pour changer l'extension de fichiers '.tt' en '.txt' on utilise les paramètres suivants :

SearchInDirectory

Affiche toutes les lignes des fichiers texte d'un répertoire contenant une expression régulière donnée.

Cette macro sert au réglage d'expressions régulières pour le traitement de sources.

Paramètres

Remarque : FindMultiLineRegExp est une version permettant de chercher des expressions sur plusieurs lignes.

SearchReplaceInDirectory

Chercher/Remplacer par lot tous les fichiers d'un dossier.

Paramètres

Remarque : MultiLineSearchReplaceInDirectory est une version permettant de chercher et remplacer des expressions sur plusieurs lignes.

Text2TXT

Traitement par lot de conversion de format de tous les fichiers textes d'un dossier (.doc, .docx, .odt, .rtf, .html…) vers le format texte brut TXT. La transformation vers TXT est assurée par LibreOffice ou OpenOffice.

Paramètres

Prérequis

Remarque : les fichiers TXT résultants peuvent être importés dans TXM en les déposant dans un nouveau répertoire et en indiquant ce répertoire comme source du module d'import TXT+CSV.

Excel2XML, ExcelDir2XML

Introduction

Macros de transformation d'un fichier Excel .xlsx, dont certains champs contiennent du texte, en un fichier XML importable dans TXM avec le module d'import XTZ+CSV pour une analyse textométrique4).

Deux macros sont disponibles :

Le fichier XML résultat des macros transcode le tableau d'entrée de la façon suivante :

L'idée est de pouvoir comparer dans TXM les unités textuelles entre elles, soit les répondants par exemple, en s'appuyant sur leurs propriétés (issues de certaines colonnes de la ligne, ou caractéristiques du répondant par exemple) et sur les mots qu'ils utilisent dans leurs réponses (issues de certaines colonnes de la ligne, ou réponses textuelles à chaque question “textuelle” non fermée par exemple).

Installation des macros

  1. télécharger l'archive Excel2XML.zip
  2. décompresser l'archive
  3. copier les deux macros Excel2XMLMacro.groovy et ExcelDir2XMLMacro.groovy se trouvant dans le répertoire 'Excel2XML/office/macro' dans <répertoire utilisateur>/TXM/scripts/macro/org/txm/macro/office
  4. copier les fichiers .jar5) se trouvant dans le répertoire 'Excel2XML/office/lib' dans <répertoire utilisateur>/TXM/scripts/lib
  5. quitter, puis relancer TXM

Paramètres

Exemple de tableau d'entrée : enquête.xlsx

identifiant date de la réponse âge sexe réponse à Q1 réponse à Q2
id1 01/02/2018 23 F Réponse à la première question par le premier répondant. Réponse à la deuxième question par le premier répondant.
id2 02/02/2018 24 H Réponse à la première question par le deuxième répondant. Réponse à la deuxième question par le deuxième répondant.
id3 01/02/2018 25 H Réponse à la première question par le troisième répondant. Réponse à la deuxième question par le troisième répondant.

Fichier XML résultat : enquête.xml

Obtenu avec les paramètres de conversion suivants :

<?xml version="1.0" encoding="UTF-8"?>
<enquete>
  <pb n="1"/>
  <reponse identifiant="id1" datedelareponse="01/02/2018" datedelareponsejour="01" datedelareponsejoursemaine="jeudi" datedelareponsemois="02" datedelareponseannee="2018" age="23" sexe="F">
    <metadata><list type="unordered">
<item>identifiant : id1 </item>
<item>date de la réponse : 01/02/2018 </item>
<item>âge : 23</item>
<item>sexe : F </item>
    </list></metadata>
    <reponseaq1><p><head><hi>réponse à Q1 : </hi></head>Réponse à la première question par le premier répondant. </p></reponseaq1>
    <reponseaq2><p><head><hi>réponse à Q2 : </hi></head>Réponse à la deuxième question par le premier répondant. </p></reponseaq2>
  </reponse>
  <pb n="2"/>
  <reponse identifiant="id2" datedelareponse="02/02/2018" datedelareponsejour="02" datedelareponsejoursemaine="vendredi" datedelareponsemois="02" datedelareponseannee="2018" age="24" sexe="H">
    <metadata><list type="unordered">
<item>identifiant : id2 </item>
<item>date de la réponse : 02/02/2018 </item>
<item>âge : 24</item>
<item>sexe : H </item>
    </list></metadata>
    <reponseaq1><p><head><hi>réponse à Q1 : </hi></head>Réponse à la première question par le deuxième répondant. </p></reponseaq1>
    <reponseaq2><p><head><hi>réponse à Q2 : </hi></head>Réponse à la deuxième question par le deuxième répondant. </p></reponseaq2>
  </reponse>
  <pb n="3"/>
  <reponse identifiant="id3" datedelareponse="01/02/2018" datedelareponsejour="01" datedelareponsejoursemaine="jeudi" datedelareponsemois="02" datedelareponseannee="2018" age="25" sexe="H">
    <metadata><list type="unordered">
<item>identifiant : id3 </item>
<item>date de la réponse : 01/02/2018 </item>
<item>âge : 25</item>
<item>sexe : H </item>
    </list></metadata>
    <reponseaq1><p><head><hi>réponse à Q1 : </hi></head>Réponse à la première question par le troisième répondant. </p></reponseaq1>
    <reponseaq2><p><head><hi>réponse à Q2 : </hi></head>Réponse à la deuxième question par le troisième répondant. </p></reponseaq2>
  </reponse>
</enquete>

Remarque : on voit que le paramètre choisi pour 'dateColumnList' a provoqué l'extraction des différents éléments composant la date en créant plusieurs propriétés :

Le ou les fichiers XML résultat peuvent être importés dans TXM en les déposant dans un répertoire source et en indiquant ce répertoire comme source de la commande 'Fichier / Importer / XTZ+CSV'.

Il est recommandé les paramètres suivants pour le module d'import XTZ+CSV :


1

  • identifiant : id1
  • date de la réponse : 01/02/2018
  • âge : 23
  • sexe : F

réponse à Q1 :

Réponse à la première question par le premier répondant.

réponse à Q2 :

Réponse à la deuxième question par le premier répondant.


Première page de l'édition du texte correspondant au tableau enquête.xlsx. Cette page correspond à la première ligne du tableau.

Avec le corpus construit on peut, par exemple, comparer des catégories de répondants entre elles en réalisant un calcul de spécificité du vocabulaire sur une partition. Par exemple sur une partition des valeurs de la propriété 'sexe' des structures 'reponse'.

CSV2XML

Macro de transformation d'un tableau au format CSV, dont certains champs contiennent du texte, en un fichier XML importable dans TXM avec le module d'import XML/w+CSV pour une analyse textométrique. Cette macro est un premier prototype du futur module d'import de TXM de sources sous forme de tableau au format CSV, dans l'esprit du logiciel Dtm-Vic de Ludovic Lebart (cf Manuel d'Utilisation de Dtm-Vic, seconde édition (2013) section “IV. Importation, création et exportation des fichiers au format Dtm-Vic”) qui traite typiquement ce genre de sources.

Le fichier XML construit par la macro transcode le tableau d'entrée de la façon suivante :

L'idée est de pouvoir comparer dans TXM les unités textuelles entre elles, soit les répondants, en s'appuyant sur leurs propriétés (issues de certaines colonnes de la ligne, ou caractéristiques du répondant) et sur les mots qu'ils utilisent dans leurs réponses (issues de certaines colonnes de la ligne, ou réponses textuelles à chaque question “textuelle” non fermée).

Paramètres

Les noms des paramètres sont encore susceptibles d'évoluer

Exemple de tableau d'entrée : sondage.csv

identifiant age sexe reponse1 reponse2
id1 23 F Réponse à la première question par le premier répondant. Réponse à la deuxième question par le premier répondant.
id2 24 H Réponse à la première question par le deuxième répondant. Réponse à la deuxième question par le deuxième répondant.
id3 25 H Réponse à la première question par le troisième répondant. Réponse à la deuxième question par le troisième répondant.

Fichier XML résultat : sondage.xml Avec les paramètres suivants :

 <corpus>
  <text identifiant="id1" age="23" sexe="F">
   <reponse1>
    Réponse à la première question par le premier répondant.
   </reponse1>
   <reponse2>
    Réponse à la deuxième question par le premier répondant.
   </reponse2>
  </text>
  <pb/>
  <text identifiant="id2" age="24" sexe="H">
   <reponse1>
    Réponse à la première question par le deuxième répondant.
   </reponse1>
   <reponse2>
    Réponse à la deuxième question par le deuxième répondant.
   </reponse2>
  </text>
  <pb/>
  <text identifiant="id3" age="25" sexe="H">
   <reponse1>
    Réponse à la première question par le troisième répondant.
   </reponse1>
   <reponse2>
    Réponse à la deuxième question par le troisième répondant.
   </reponse2>
  </text>
  <pb/>
 </corpus>

Le fichier XML résultat peut alors être importé dans TXM en le déposant dans un nouveau répertoire et en indiquant ce répertoire comme source de la commande 'Fichier / Importer / XML/w+CSV'.

On peut alors, par exemple, comparer les catégories de répondants entre elles en réalisant un calcul de spécificité du vocabulaire d'une partition sur la structure 'text' avec la propriété 'sexe'.

TXT2XML

Transforme tous les fichiers TXT d'un répertoire en fichiers XML. Les fichiers XML sont déposés dans un sous-répertoire résultat 'out'.

La macro transforme :

Elle n'ajoute aucun encodage XML supplémentaire.

Paramètres

Remarque : le répertoire résultat peut être importé dans TXM en l'indiquant comme répertoire source du module d'import XML/w+CSV.

Taltac2XML

Transforme un fichier au format Taltac en un fichier au format XML pour être importé par le module XTZ+CSV :

La macro transforme par ailleurs :

Le nom du fichier résultat est créé à partir du nom du fichier d'entrée en ajoutant le suffixe '.xml'.

Paramètres

Import dans TXM :

TeiHeader2MetadataCSV

Récupère des informations dans les entêtes TEI de fichiers source pour construire un tableau de métadonnées “metadata.csv”.

Paramètres

Remarque : n'importe quel format XML peut être utilisé pour réaliser des extractions. Les requêtes XPath n'ont pas à être liées à la TEI et ne sont pas limitées à des sous-élements de teiHeader.

Exemple

Exemple de fichier de paramètres “propertiesFile”, le fichier “est-republicain.properties” pour le corpus “Est républicain”7) :

date-edition-en-clair=/tei:TEI/tei:teiHeader/tei:fileDesc/tei:titleStmt/tei:title/tei:date/text()
date-edition-formatée=/tei:TEI/tei:teiHeader/tei:fileDesc/tei:titleStmt/tei:title/tei:date/@when

Glose :

Le fichier “metadata.csv” résultant pour l'année 1999 (répertoire de sources “Annee1999”) a la forme suivante :

id,date-edition-en-clair,date-edition-formatée
1999-06-09,"9 juin 1999","1999-06-09"
1999-07-04,"4 juillet 1999","1999-07-04"
1999-07-10,"10 juillet 1999","1999-07-10"
1999-07-29,"29 juillet 1999","1999-07-29"
1999-08-07,"7 août 1999","1999-08-07"
1999-05-29,"29 mai 1999","1999-05-29"
1999-07-07,"7 juillet 1999","1999-07-07"
1999-09-19,"19 septembre 1999","1999-09-19"
...

XMLStatistics

Calcul de la table des fréquences de toutes les balises et attributs XML utilisées dans les fichiers d'un dossier (utile pour une vue d'ensemble quantitative de l'usage des balises dans des documents dont on ne connait pas les principes d'encodage).

Paramètres

ExecXSL

Traitement par lot d'application d'une feuille de transformation XSLT sur tous les fichiers XML d'un dossier.

Paramètres

TextTranscription2TRS

Assistance à l'encodage et à la transformation de transcriptions en format texte (.doc, .odt, .rtf du logiciel Transana) vers le format XML du logiciel Transcriber pour l'import dans TXM avec le module d'import Transcriber+CSV.

Utilisation

Voir le tutoriel import de transcriptions d'enregistrements TXT-ODT-RTF-DOC dans TXM.

Paramètres

EuroPresse2XML

Assistance à la récupération et à la transformation des exports HTML du portail EuroPresse pour l'import dans TXM avec le module d'import XML/w+CSV.

Utilisation

Voir le tutoriel Europresse.

Paramètres

TXM2CoNLL2009

Exporte un corpus au format CoNLL2009.

Utilisation

Sélectionner le corpus à exporter dans la vue corpus, puis lancer la macro.

Paramètres

PennTreebank2TIGER

Conversion par lot ou par fichier du format Penn Treebank au format TIGER-XML.

Paramètres

Réglage des éditions de texte

AddFacsAttribute, FacsEditionBuilder et EditionUpdater

Ces macros ont été rendues obsolètes par l'introduction du module d'import XTZ+CSV et ses possibilités de construction d'éditions synoptiques avec fac-similé (qui reproduit en partie leur code).

Assistance au réglage des éditions de texte d'un corpus ayant des sources XML :

Utilisation

Voir le tutoriel de construction d'éditions synoptiques.

Paramètres

AddFacsAttribute :

FacsEditionBuilder :

EditionUpdater :

Variantes de commandes TXM

NIndex

Installation de la macro

  1. télécharger la macro NIndexMacro.groovy
  2. copier le fichier dans <répertoire utilisateur>/TXM/scripts/macro/org/txm/macro/commands
  3. télécharger la macro CQPUtilsMacro.groovy
  4. copier le fichier dans <répertoire utilisateur>/TXM/scripts/macro/org/txm/macro/cqp
  5. dans TXM 0.7.9 ou inférieur, installer les bibliothèques Java complémentaires suivantes :
    1. télécharger l'archive office.zip
    2. copier dans <répertoire utilisateur>/TXM/scripts/lib les 7 fichiers qu'elle contient :
      • commons-validator-1.4.0.jar
      • java-rdfa-0.4.2.jar
      • jena-core-2.7.4.jar
      • jena-iri-0.9.4.jar
      • odfdom-java-0.8.10-incubating.jar
      • org.apache.xerces_2.9.0.v201101211617.jar
      • simple-odf-0.8.1-incubating.jar
    3. quitter puis relancer TXM
  6. ouvrir ou rafraichir la vue Macro
  7. accéder au répertoire 'commands'
  8. double-cliquer sur l'icone de la macro NIndex pour la lancer

Fonctionnement de la macro

La macro NIndex assiste le décompte de séquences de mots dans des corpus ou des sous-corpus. Elle généralise la commande Index de TXM 0.7.8 à N requêtes CQL. Les séquences sont fournies dans un fichier d'entrée (paramètre inputFile), au format général d'une séquence par ligne. Trois formats de séquences sont proposés :

Dans les séquences de formes de mots et d'expressions régulières sur les formes de mots, les formes et les expressions régulières sont séparées par un caractère espace (pour chercher une forme contenant un espace il faut utiliser une expression régulière exprimant ce caractère Unicode).

Types de séquences

Le type de séquences interprété par NIndex est déterminé par le paramètre inputIsCQL. Si ce paramètre est sélectionné (vrai), les séquences sont interprétées comme des requêtes CQL ; sinon elles sont interprétées soit comme des formes soit comme des expressions régulières de formes en fonction du contenu de chaque ligne.

Le paramètre inputWordProperty permet de choisir la propriété de mot qui sera utilisée pour les recherches de séquences de formes ou de séquences d'expression régulière de forme. Par exemple :

Propriété de mot dénombrée

Le paramètre outputWordProperty permet de choisir quelle propriété de mot sera utilisée pour réaliser le dénombrement des séquences trouvées. Par exemple :

Regroupement des décomptes par séquence

Quand les séquences sont des requêtes CQL ou des expressions régulières, il est possible de regrouper les décomptes de leurs réalisations en sélectionnant le paramètre groupByQuery. Dans ce cas il y a une fréquence par séquence dans le tableau de sortie.

Liste des corpus à interroger

Les corpus dans lesquels chercher sont soit sélectionnés dans la vue Corpus (avant de lancer la macro), soit fournis sous la forme d'une liste de noms de corpus à l'appel de la macro par une autre macro.

Format de sortie

La macro NIndex écrit son résultat dans un fichier de sortie (paramètre outputFile), deux formats sont proposés :

Quand le paramètre odsOutputFormat est sélectionné la sortie se fait au format ODS, sinon TSV.

Sortie au format ODS

La sortie au format tableur est composée de deux feuilles :

Appel répétitif de commandes TXM

CrossedPartitionBuilder

Construit une partition en croisant les différentes valeurs de plusieurs propriétés d'une même structure.

Utilisation

Sélectionner le corpus pour lequel produire la partition puis lancer la macro.

Paramètres

Appel de commandes CQP

CreateCQPList

Permet de définir une liste de mots (ou plus généralement de valeurs de propriétés) utilisable dans les requêtes CQL.

Utilisation

Un tutoriel complet d'utilisation est disponible Tutoriel des listes CQL

Paramètres

A éditer directement dans le fichier script.

ExecCQP

Permet de faire exécuter une ligne de commande au moteur CQP.

Utilisation

Les instructions d'utilisation se trouvent en commentaire au début du fichier script avec un rappel des commandes CQP utiles.

Paramètres

SetMatchingStrategy

Permet de changer la stratégie de résolution des opérateurs ?, *, + sur les occurrences du langage de requêtes CQL au cours d'une session de travail. Par exemple, pour la requête8) :

[enpos="DET"]? [enpos="ADJ"]* [enpos="NN"] ([enpos="PREP"] [enpos="DET"]? [enpos="ADJ"]* [enpos="NN"])*

Avec le texte suivant à interroger :

    the old book on the table in the room

r1=         book
r2=                     table
r3=                                  room

r1= the old book on the table in the room

r1= the old book
r2=                 the table
r3=                              the room

r1= the old book
r2=     old book
r3=         book
r4=                 the table
r5=                     table
r6=                              the room
r7=                                  room

La stratégie de résolution par défault est 'standard'.

Paramètres

Appel de scripts R

ExecR

Dessine l'histogramme des fréquences d'un index dans un SVG et l'affiche dans une fenêtre de TXM.

Utilisation

Il faut sélectionner un index (de corpus ou de partition) dans la vue Corpus avant de lancer la macro. Il n'y a pas de filtrage d'affichage, il faut donc filtrer l'index en amont de la macro. L'ordre des barres est celui des lignes de résultat de l'index.

Paramètres

Aucun

PlotSpecif

Appel la fonction “specificities.distribution.plot” du package textometry pour afficher la courbe de densité du modèle statistique des spécificités.

Utilisation

Pour plus de détail sur la fonction “specificities.distribution.plot”, voir la documentation du package

Paramètres

Outils statistiques complémentaires

BasicVocabulary

Ce traitement implémente le concept textométrique de “forme(s) de base” et “vocabulaire de base” (on parle quelquefois aussi de “forme banale” et de “banalité”), cf. par ex. Lafon 1980 p. 152, ou Lebart & Salem 1994 p. 176 - les références bibliographiques complètes sont dans la rubrique Documents de référence du site Textométrie. Une forme (un mot) de base est un mot qui n'est spécifique dans aucune partie. En pratique, la macro BasicVocabulary exporte dans un fichier tous les mots de base automatiquement repérés dans un tableau de spécificités, en fonction d'un indice (ou score) de spécificité maximum. Le tableau produit reprend les colonnes du tableau initial de spécificités en insérant en plus, après la colonne F (fréquence totale du mot), une colonne “score_max”, donnant le maximum des indices de spécificité (en valeur absolue) sur la ligne (sorte d'amplitude maximale de la spécificité du mot sur l'ensemble de parties considéré).

Utilisation

Il faut sélectionner un tableau de spécificités dans la vue Corpus avant de lancer la macro. Pour le choix du scoreMax :

Paramètres

Specif2Coin

[voir également la macro Specif2Throw plus récente et plus générale]

Affiche la probabilité a priori (avant de faire les lancés) d'obtenir N faces 'pile' consécutives en lançant une pièce au pile ou face, en regard avec la spécificité équivalente. On considère qu'une pièce a 50% de chances (1 chance sur 2) de tomber sur la face 'pile' à chaque lancé - la pièce n'est pas biaisée et les lancés sont indépendants.

Utilisation

Lancer la macro directement par double-clic.

Paramètres

La macro prend un seul paramètre et trois options :

La macro affiche - selon les options :

Les limites du calcul sont celles de la machine. Une machine 64-bit peut typiquement calculer la probabilité de 1023 lancés consécutifs.

Cartographie

FranceMercatorIGNMap

Cette macro ouvre une carte de France interactive dans TXM, centrée sur une adresse donnée. Elle utilise les services web du Géoportail de l'IGN.

Installation de la macro

  1. télécharger la macro FranceMercatorIGNMapMacro.groovy
  2. copier le fichier dans <répertoire utilisateur>/TXM/scripts/macro/org/txm/macro/map
  3. télécharger l'archive de librairies Javascript leaflet.zip
  4. extraire l'archive dans <répertoire utilisateur>/TXM/results, ceci doit créer le répertoire 'leaflet' dans le répertoire 'results' (là où sera générée la page HTML de chaque carte produite)

Fonctionnement de la macro

Vous devez être connecté à Internet pour que la macro puisse fonctionner :

  1. ouvrir la vue Macro
  2. accéder au répertoire 'map'
  3. double-cliquer sur l'icone de la macro FranceMercatorIGNMap pour la lancer

La macro prend deux paramètres :

Quand elle est lancée :

Remarque : les services web du Géoportail de l'IGN proposent deux ensembles de couches : en projection Mercator et en projection Lambert93. Cette macro propose un jeu de couches pris dans l'ensemble Mercator. On peut choisir d'autres couches en changeant le code de la macro. Votre clé d'accès détermine si vous pouvez accéder à telle ou telle couche.

Remarque2 : la récupération des informations depuis les serveurs de l'IGN peut être assez lente, en dizaines de secondes.

Multimédia

refaireTRS

Cette macro met à jour l'édition d'une transcription importée avec le module d'import XML Transcriber+CSV pour pouvoir jouer le son de chaque énoncé depuis l'édition en cliquant dessus.

Installation de la macro

  1. télécharger la macro refaireTRSMacro.groovy
  2. copier le fichier dans <répertoire utilisateur>/TXM/scripts/macro/org/txm/macro/edition
  3. télécharger la feuille XSL refaireEditionTRS.xsl
  4. copier le fichier dans <répertoire utilisateur>/TXM/xsl

Fonctionnement de la macro

La macro prend deux paramètres :

Lancement :

  1. ouvrir la vue Macro
  2. accéder au répertoire 'edition'
  3. double-cliquer sur l'icone de la macro refaireTRS pour la lancer

Fonctionnement des éditions après l'exécution de la macro

1) langage de script empruntant les meilleurs traits de langage à Python, Ruby et Perl, et dont la sémantique repose entièrement sur celle du langage de robustesse industrielle Java - tout script Groovy est compilé à la volée vers la machine virtuelle Java afin d'être exécuté. Ce langage donne donc accès à tous les composants Java de la plateforme TXM (toutes ses classes, ses commandes, ses modules d'import, ses éditeurs, etc.) ainsi qu'à tous ses composants interfacés par Java comme CQP et R.
2) le '\' est nécessaire car il s'agit d'expressions régulières
3) Voir la section “Summary of regular-expression constructs”
4) ces macros sont une évolution de la macro CSV2XML
5) librairies Java du projet Apache POI manipulant les fichiers Excel
6) .xlsx est le format recommandé. Le traitement de fichiers .xls ne fonctionne pas toujours correctement
8) d'après The CQP Query Language Tutorial, (CWB version 2.2.b90), Stefan Evert, 10 July 2005
9) équivalent de la stratégie 'greedy' des expressions régulières - voir https://docs.oracle.com/javase/tutorial/essential/regex/quant.html
10) équivalent de la stratégie 'reluctant' des expressions régulières - voir https://docs.oracle.com/javase/tutorial/essential/regex/quant.html