Outils pour utilisateurs

Outils du site


public:macros_encours_de_publication

Ceci est une ancienne révision du document !


Macros en cours de publication

Cette page contient la documentation des macros destinées à être publiées dans la page de documentation du wiki txm-users : Documentation des macros

Une fois la macro prête à être publiée, il faut déplacer sa documentation dans une section appropriée sur le wiki txm-users.

Patron de la documentation

Introduction et description de ce que fait la macro.

Paramètres

  • nom du paramètre1 : description du paramètre avec un exemple ou la valeur par défaut
  • nom du paramètre2 : description du paramètre avec un exemple ou la valeur par défaut
  • nom du paramètre3 : description du paramètre avec un exemple ou la valeur par défaut
    Convention : les noms de variables sont en camelBack

DTM2XML

Cette macro développe un prototype de transformation de format de sources de type CSV pour aider à importer dans TXM des corpus en forme de tableau avec l'import XML/w+CSV ; et pour étudier la création d'un nouveau module d'import TXM.

Il peut servir à importer dans TXM des corpus comme ceux manipulés par le logiciel Dtm-Vic (Ludovic Lebart) (cf “Manuel d'Utilisation de Dtm-Vic, seconde édition (2013) section “IV. Importation, création et exportation des fichiers au format Dtm-Vic”).

Paramètres

Les noms de paramètres vont changer
  • inputFile : fichier CSV à transformer
  • columnSeparator : caractère séparateur de colonnes du fichier CSV (par défaut : caractère 'Tabulation')
  • characterEncoding : système d'encodage des caractères du fichier CSV (par défaut : Unicode UTF-8)
  • rootTag : nom de la balise XML racine (par exemple : 'corpus')
  • textTag : nom de la balise XML encodant les unités textuelles (par exemple : 'text')
  • metadataColumnList : liste des noms de colonnes à utiliser comme métadonnées de texte, séparés par une virgule : (par exemple : 'identifiant,age,sexe')
  • textColumnList : liste des noms de colonnes à utiliser comme contenu textuel, séparés par une virgule : (par exemple : 'reponse1,reponse2'
    Remarque : Les noms de colonnes ne doivent pas contenir de caractères spéciaux ni accentués ou de ponctuation (espace, etc.)

TXT2XML

Transforme tous les fichiers TXT d'un répertoire en fichiers XML déposés dans un sous-répertoire résultat 'out'.

Paramètres

Les noms de paramètres vont changer
  • inputDirectory : Répertoire des fichiers à transformer
  • characterEncoding : système d'encodage des caractères des fichiers texte (par défaut : Unicode UTF-8)
  • rootTag : nom de la balise XML racine des fichiers XML produits (par exemple : 'text')

FindRegExp

Affiche toutes les lignes contenant une expression régulière donnée dans les fichiers texte d'un répertoire.

Cette macro sert au réglage d'expressions régulières pour le traitement de sources.

Paramètres

  • inputDirectory : Répertoire des fichiers à chercher
  • regExp : l'expression régulière à chercher
  • characterEncoding : système d'encodage des caractères des fichiers (par défaut : Unicode UTF-8)
public/macros_encours_de_publication.1395825119.txt.gz · Dernière modification: 2014/03/26 10:11 par slh@ens-lyon.fr