Outils pour utilisateurs

Outils du site


public:import_csv

Import de fichier(s) CSV

Objectif

L'objectif principal de ce module d'import est de prendre en charge des tableaux TSV issus de sondages dans lesquels les questions sont à la fois fermées (choix simple ou multiple) et ouvertes (dans la lignée du logiciel DTM). Les colonnes correspondant aux réponses aux questions ouvertes forment le matériau textuel que TXM pourra exploiter (chaque question pouvant former une section du “texte” d'un répondant) et le reste des colonnes codent des métadonnées (du répondant).

Ce module peut également être utilisé pour importer des corpus où chaque ligne code un (petit) texte avec ses métadonnées, comme Iramuteq peut avoir à en traiter.

Ce module peut être une voie d'import de corpus volumineux composés de petits textes tenants dans un format rudimentaire (tweets, sms, etc.).

Exemples de cas

Méthode

Solution

Script prototype de conversion CVS > XML

Une première version de script a été faite qui peut gérer les 2 cas suivants :

  • Un seul fichier CSV qui contient un texte par ligne
  • Plusieurs fichiers CSV. Un fichier est un texte, chaque ligne est une division du texte

Chaque ligne est une entrée (de texte ou de partie de texte) La colonne “id” contient l'identifiant de la ligne La colonne “text” contient le contenu du texte Tout autre colonne sera interprété comme métadonnée de texte ou propriété de partie

Le résultat du script peut être importé avec le module XML/w

Il faut faire évoluer ce script ou repartir de ce script pour gérer les cas décris dans la section Objectifs

2e Script prototype de conversion CVS > XML

Partir du précédent script mais :

  • en pouvant spécifier plusieurs colonnes de texte

Protocole de test

État de la plate-forme

Recette

Discussion

Objectif

public/import_csv.txt · Dernière modification: 2013/10/30 17:21 par matthieu.decorde@ens-lyon.fr