Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

public:macros [2019/03/13 13:15]
slh@ens-lyon.fr
public:macros [2019/03/13 13:27] (version actuelle)
slh@ens-lyon.fr
Ligne 222: Ligne 222:
    * textTag : nom de la balise XML encodant les unités textuelles correspondant à chaque ligne du tableau d'entrée (par exemple : 'reponse')     * textTag : nom de la balise XML encodant les unités textuelles correspondant à chaque ligne du tableau d'entrée (par exemple : 'reponse')
-=== Exemple de tableau d'entrée ===+=== Exemple de tableau .xlsx de départ ===
{{:public:enquete.xlsx|enquête.xlsx}} {{:public:enquete.xlsx|enquête.xlsx}}
Ligne 231: Ligne 231:
| id3   | 01/02/2018 | 25 | H | Réponse à la première question par le troisième répondant. | Réponse à la deuxième question par le troisième répondant. | | id3   | 01/02/2018 | 25 | H | Réponse à la première question par le troisième répondant. | Réponse à la deuxième question par le troisième répondant. |
-=== Fichier XML résultat : enquête.xml === +=== Exemple de fichier .xml résultat de la conversion du tableau .xlsx  ===
- +
-Obtenu avec les paramètres de conversion suivants :  +
-  * rootTag : enquete +
-  * textTag : reponse +
-  * metadataColumnList : identifiant,date de la réponse,âge,sexe +
-  * dateColumnList : date de la réponse +
-  * textColumnList : réponse à Q1,réponse à Q2+
 +**enquête.xml** :
<code xml> <code xml>
<?xml version="1.0" encoding="UTF-8"?> <?xml version="1.0" encoding="UTF-8"?>
Ligne 278: Ligne 272:
</enquete> </enquete>
</code> </code>
 +
 +Obtenu avec les paramètres de conversion suivants :
 +  * rootTag : enquete
 +  * textTag : reponse
 +  * metadataColumnList : identifiant,date de la réponse,âge,sexe
 +  * dateColumnList : date de la réponse
 +  * textColumnList : réponse à Q1,réponse à Q2
Remarque : on voit que le paramètre choisi pour 'dateColumnList' a provoqué l'extraction des différents éléments composant la date en créant plusieurs propriétés : Remarque : on voit que le paramètre choisi pour 'dateColumnList' a provoqué l'extraction des différents éléments composant la date en créant plusieurs propriétés :
Ligne 286: Ligne 287:
  * datedelareponseannee="2018" : l'année   * datedelareponseannee="2018" : l'année
-=== Import dans TXM ===+=== Import du fichier .xml dans TXM ===
-  - copier le ou les fichiers XML résultats dans un répertoire source+  - copier le ou les fichiers .xml résultats dans un répertoire source
  - lancer l'import XTZ+CSV (commande 'Fichier / Importer / XTZ+CSV')   - lancer l'import XTZ+CSV (commande 'Fichier / Importer / XTZ+CSV')
    * désigner le répertoire source     * désigner le répertoire source
    * il est recommandé les paramètres d'import suivants :     * il est recommandé les paramètres d'import suivants :
      * Éditions > Nombre de mots par page = 100000\\ Un grand nombre de mots par page permet d'obtenir tout le contenu d'une ligne du tableau d'origine dans une seule page d'édition du texte construit       * Éditions > Nombre de mots par page = 100000\\ Un grand nombre de mots par page permet d'obtenir tout le contenu d'une ligne du tableau d'origine dans une seule page d'édition du texte construit
-      * Plans textuels > Hors texte à éditer = metadata\\ Chaque unité textuelle correspondant à une ligne du tableau source commence par la liste de ses propriétés (ou métadonnées), et cette liste est encadrée par une structure "%%<metadata>%%". Placer la structure "%%<metadata>%%" dans le champ "Hors texte à éditer" permet de ne pas mettre les mots de cette liste dans les mots de l'unité textuelle, tout en les affichant dans l'édition de l'unité textuelle. Comme dans l'exemple suivant (de la page correspondant à la première ligne du tableau exemple) :+      * Plans textuels > Hors texte à éditer = metadata
 +Remarque : chaque unité textuelle correspondant à une ligne du tableau source commence par la liste de ses propriétés (ou métadonnées), et cette liste est encadrée par une structure "%%<metadata>%%". Placer la structure "%%<metadata>%%" dans le champ "Hors texte à éditer" permet de ne pas mettre les mots de cette liste dans les mots de l'unité textuelle, tout en les affichant dans l'édition de l'unité textuelle.
 +
 +=== Exploitation dans TXM ===
 +
 +Avec le corpus construit on peut, par exemple, comparer des catégories de répondants entre elles en réalisant un calcul de spécificité du vocabulaire sur une partition. Par exemple sur une partition des valeurs de la propriété 'sexe' des structures 'reponse'.
 +
 +== Exemple d'édition ==
 +
 +Première page de l'édition du texte correspondant au tableau enquête.xlsx (correspond à la première ligne du tableau).
 +
 +<note>
<html><body style="box-shadow: .3125em .3125em .625em 0 #888;background-color:powderblue;"><hr><div class="txmeditionpage" <html><body style="box-shadow: .3125em .3125em .625em 0 #888;background-color:powderblue;"><hr><div class="txmeditionpage"
><p class="txmeditionpb" align="center">1</p> ><p class="txmeditionpb" align="center">1</p>
Ligne 326: Ligne 338:
 <span title=" n:19 frpos:NOM frlemma:réponse" id="w_macrodoctablesample_19">Réponse</span> <span title=" n:20 frpos:PRP frlemma:à" id="w_macrodoctablesample_20">à</span> <span title=" n:21 frpos:DET:ART frlemma:le" id="w_macrodoctablesample_21">la</span> <span title=" n:22 frpos:NUM frlemma:deuxième" id="w_macrodoctablesample_22">deuxième</span> <span title=" n:23 frpos:NOM frlemma:question" id="w_macrodoctablesample_23">question</span> <span title=" n:24 frpos:PRP frlemma:par" id="w_macrodoctablesample_24">par</span> <span title=" n:25 frpos:DET:ART frlemma:le" id="w_macrodoctablesample_25">le</span> <span title=" n:26 frpos:NUM frlemma:premier" id="w_macrodoctablesample_26">premier</span> <span title=" n:27 frpos:NOM frlemma:répondant" id="w_macrodoctablesample_27">répondant</span><span title=" n:28 frpos:SENT frlemma:." id="w_macrodoctablesample_28">.</span></p>  <span title=" n:19 frpos:NOM frlemma:réponse" id="w_macrodoctablesample_19">Réponse</span> <span title=" n:20 frpos:PRP frlemma:à" id="w_macrodoctablesample_20">à</span> <span title=" n:21 frpos:DET:ART frlemma:le" id="w_macrodoctablesample_21">la</span> <span title=" n:22 frpos:NUM frlemma:deuxième" id="w_macrodoctablesample_22">deuxième</span> <span title=" n:23 frpos:NOM frlemma:question" id="w_macrodoctablesample_23">question</span> <span title=" n:24 frpos:PRP frlemma:par" id="w_macrodoctablesample_24">par</span> <span title=" n:25 frpos:DET:ART frlemma:le" id="w_macrodoctablesample_25">le</span> <span title=" n:26 frpos:NUM frlemma:premier" id="w_macrodoctablesample_26">premier</span> <span title=" n:27 frpos:NOM frlemma:répondant" id="w_macrodoctablesample_27">répondant</span><span title=" n:28 frpos:SENT frlemma:." id="w_macrodoctablesample_28">.</span></p>
</div><hr></body></html> </div><hr></body></html>
- +</note>
-| Première page de l'édition du texte correspondant au tableau enquête.xlsx. Cette page correspond à la première ligne du tableau. | +
- +
-=== Exploitation dans TXM === +
- +
-Avec le corpus construit on peut, par exemple, comparer des catégories de répondants entre elles en réalisant un calcul de spécificité du vocabulaire sur une partition. Par exemple sur une partition des valeurs de la propriété 'sexe' des structures 'reponse'.+
==== CSV2XML ==== ==== CSV2XML ====
public/macros.txt · Dernière modification: 2019/03/13 13:27 par slh@ens-lyon.fr