Projets utilisant TXM pour l'analyse de transcriptions

Cette page sert de support au suivi des activités, notamment d'ICAR, utilisant TXM pour l'analyse de transcriptions. Dans la mesure où elle est pour l'instant accessible publiquement, on essaye de maintenir un niveau d'anonymat minimum.

D'autres projets ayant leur propre page analysent des transcriptions :

Certains projets font l'objet de tickets de suivi.

Import de transcriptions dans TXM

TXM importe des transcriptions au format XML-TRS (du logiciel Transcriber) par le biais du module TRS+CSV.

La macro 'TextTranscription2TRS' a été développée pour transformer des transcriptions RTF issues de Transana selon les conventions d'ICAR 2 dans le format XML-TRS, importable directement dans TXM avec le module 'TRS+CSV'.

Elle est suffisamment générale pour importer des transcriptions d'enregistrements en format texte libre :

  • TXT
  • RTF
  • ODT
  • DOC
  • etc.

Cette macro est documentée ici : https://groupes.renater.fr/wiki/txm-users/public/macros#texttranscription2trs.

Un tutoriel a été écrit pour l'utiliser. Ce tutoriel a valeur :

  • de spécification
  • de recette
  • de manuel

Spécification de la macro

La macro est décomposée en 4 scripts :

  • TextTranscription2TRSMacro : point d'entrée
    • Transana2TRS :
      • étape 1 : conversion ODT → HTML
      • étape 2 - HTML2TRS : conversion HTML → TRS
      • étape 3 - FixTransanaTimings : saturation des marques de synchronisation pour la conformité avec le format TRS

Cette macro s'utilise de façon cyclique pour débugger les transcriptions sources jusqu'à l'obtention de transcriptions TRS (Transcriber) conformes (étape 2).

La macro a besoin de la présence de Libre Office ou Open Office pour l'étape 1.

Le tutoriel décrit les conventions interprétées dans l'étape 2 (en texte brut).

La macro utilise des fichiers annexes :

  • trans-14.dtd : la DTR du format TRS

L'archive de la macro contient le modèle TreeTagger pour l'écrit et l'oral produit par le projet PERCEO : http://www.cnrtl.fr/corpus/perceo.

Diffusion de la macro

La macro est téléchargeable depuis SF dans l'archive transana-rtf-odt-doc-txt-transcription4txm.zip.

Projets d'ICAR 1 et 2

Didactique des sciences

Cours de Physique - AT

Requêtes spécifiques sur le discours du professeur.

Ce projet a notamment permis :

Cours de Physique - JPM

Analyse longitudinale sur une année.

Corpus en cours de transcription.

Didactique des langues

Cours de langues - NB : discours des apprenants (anglais)

Usage de formulations CQL.

Ce projet a produit des diapositives de sorties TXM pour une communication.

Cours de langues - CW (postdoc ASLAN) : discours des formateurs (hollandais)

Discussions sur la préparation, l'importation et la méthode.

Interaction - BU

Autres projets

Analyse d'entretiens en sociologie urbaine - AP

Mise en place de l'ensemble de la méthodologie plus :

  • sélection de locuteurs à ignorer dans les index
  • utilisation des macros d'assistance à la correction de propriétés de mots (pos et lemme)

Sociologie des familles recomposées - QB

Discussions sur la préparation et l'import.



Retour à la liste des projets.

public/analyse_de_transcriptions_avec_txm.txt · Dernière modification: 2016/06/24 11:52 par slh@ens-lyon.fr