Liste de liens :
Liste de liens :
L'objectif principal de ce module d'import est de prendre en charge des tableaux (Excel, CSV, etc.) issus de sondages dans lesquels les questions sont à la fois fermées (choix simple ou multiple) et ouvertes (dans la lignée du logiciel DTM). Les colonnes correspondant aux réponses aux questions ouvertes forment le matériau textuel que TXM pourra exploiter (chaque question pouvant former une section du “texte” d'un répondant) et le reste des colonnes codent des métadonnées (du répondant).
Ce module peut également être utilisé pour importer des corpus où chaque ligne code un (petit) texte avec ses métadonnées, comme Iramuteq peut avoir à en traiter.
Ce module peut être une voie d'import de corpus volumineux composés de petits textes tenants dans un format rudimentaire (tweets, sms, etc.).
Une première version de script a été faite qui peut gérer les 2 cas suivants :
Chaque ligne est une entrée (de texte ou de partie de texte) La colonne “id” contient l'identifiant de la ligne La colonne “text” contient le contenu du texte Tout autre colonne sera interprété comme métadonnée de texte ou propriété de partie
Le résultat du script peut être importé avec le module XTZ
Il faut faire évoluer ce script ou repartir de ce script pour gérer les cas décrit dans la section Objectifs
Partir du précédent script mais :
Ajouter un nouveau module d'import “table” qui transforme la table en fichiers XML avant d'appeler la suite de l'import XTZ.
L'import ajoute une nouvelle section “Table” pour définir le ou les textes, les structures et les types de colonnes. La section reprend les paramètres des macros Excel2XML ou Table2XML.