Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

public:faq [2018/11/30 17:37]
slh@ens-lyon.fr
public:faq [2019/02/12 18:14] (version actuelle)
slh@ens-lyon.fr
Ligne 1281: Ligne 1281:
==== sources XML-TEI ==== ==== sources XML-TEI ====
-Voir les [[https://groupes.renater.fr/wiki/txm-users/public/tutoriels_import_xml-tei|tutoriels dédiés XML-TEI]].+Voir les [[https://groupes.renater.fr/wiki/txm-users/public/tutoriels_import_xml-tei|tutoriels dédiés aux représentations XML-TEI]]
 + 
 +==== traitements de texte .DOCX, .ODT ==== 
 + 
 +Déposer les fichiers dans un répertoire et lui appliquer le module d'import [[http://textometrie.ens-lyon.fr/html/doc/manual/0.7.9/fr/manual26.xhtml#toc112|ODT/DOC/RTF+CSV]].  
 + 
 +Ou bien convertir d'abord les fichiers en fichiers en XML-TEI avec le service en ligne [[http://www.tei-c.org/oxgarage|OxGarage]], puis importer les fichiers au format XML avec le module XTZ+CSV. 
 + 
 +Ou bien convertir d'abord les fichiers en fichiers au format TXT avec la [[https://groupes.renater.fr/wiki/txm-users/public/macros#text2txt|macro Text2TXT]], puis importer les fichiers au format TXT avec le module TXT+CSV.
==== Europresse ==== ==== Europresse ====
Ligne 1300: Ligne 1308:
Déposer le fichier dans un répertoire et lui appliquer le module d'import 'Alceste'. Déposer le fichier dans un répertoire et lui appliquer le module d'import 'Alceste'.
 +
 +==== Taltac ====
 +
 +Convertir d'abord le fichier au format Taltac en un fichier au format XML avec la [[public:macros#taltac2xml|macro Taltac2XML]], puis importer le fichier au format XML avec le module XTZ+CSV.
==== Cordial ==== ==== Cordial ====
Ligne 1328: Ligne 1340:
===== B. Transcriptions d'enregistrements ===== ===== B. Transcriptions d'enregistrements =====
-==== Transcriber, .ODT, .DOC, .RTF, .TXT ====+==== Transcriber ====
Déposer les fichiers au format .TRS (saisis avec le logiciel Transcriber) dans un répertoire et lui appliquer le module d'import 'XML Transcriber+CSV'. Déposer les fichiers au format .TRS (saisis avec le logiciel Transcriber) dans un répertoire et lui appliquer le module d'import 'XML Transcriber+CSV'.
-Vous pouvez également saisir vos transcriptions directement dans un traitement de texte (Word ou équivalent) en respectant des conventions de transcription élémentaires puis les importer dans TXM après conversion automatique. Voir le [[https://groupes.renater.fr/wiki/txm-users/public/tutoriel_import_transcriptions|tutoriel pour l'import de transcriptions]] basé sur le module d'import 'XML Transcriber+CSV'.+==== .ODT, .DOC, .RTF, .TXT ==== 
 + 
 +Vous pouvez également saisir vos transcriptions directement dans un traitement de texte (Word ou équivalent) en respectant des conventions de transcription élémentaires puis les importer dans TXM avec le module d'import 'XML Transcriber+CSV' après conversion automatique. Voir le [[https://groupes.renater.fr/wiki/txm-users/public/tutoriel_import_transcriptions|tutoriel pour l'import de transcriptions]].
==== ELAN, CLAN, Praat ==== ==== ELAN, CLAN, Praat ====
Ligne 1345: Ligne 1359:
On peut tester avec le corpus exemple '[[https://sourceforge.net/projects/txm/files/corpora/uno-tmx-sample/uno-tmx-sample-src.zip/download|uno-tmx-sample-src.zip]]'. On peut tester avec le corpus exemple '[[https://sourceforge.net/projects/txm/files/corpora/uno-tmx-sample/uno-tmx-sample-src.zip/download|uno-tmx-sample-src.zip]]'.
 +
 +===== D. Données textuelles tabulées =====
 +
 +On peut importer des données textuelles enregistrées dans des tableaux MS Excel ou LibreOffice Calc en les convertissant en XML au préalable, puis en utilisant les modules d'import basés sur le format XML (comme XML/w+CSV ou XTZ+CSV par exemple).
 +
 +Lors de la conversion, on choisira les colonnes qui deviendront des métadonnées de texte et les colonnes qui deviendront des sections de texte.
 +
 +==== CSV ====
 +
 +Convertir les fichiers .csv en .xml avec la [[public:macros#csv2xml|macro CSV2XML]].
 +
 +==== Excel ====
 +
 +Convertir les fichiers .xlsx en .xml avec la macro [[public:macros#excel2xml_exceldir2xml|macro Excel2XML]] ou ExcelDir2XML pour une conversion par lots.
 +
 +Remarque : il est conseillé d'utiliser la macro Excel2XML plutôt que CSV2XML car le format .xlsx est plus précis (moins de problèmes d'encodage de caractères, de caractère séparateur de colonnes, etc.) et Excel2XML offre plus de services.
====== Après import, certains caractères de mes textes sont illisibles. Que se passe-t-il ? ====== ====== Après import, certains caractères de mes textes sont illisibles. Que se passe-t-il ? ======
Ligne 1717: Ligne 1747:
====== Je veux faire une partition sur un sous-corpus, mais c'est bizarre, certaines parties semblent avoir disparu, ou être vides, ou la partition n'est pas créée ? ====== ====== Je veux faire une partition sur un sous-corpus, mais c'est bizarre, certaines parties semblent avoir disparu, ou être vides, ou la partition n'est pas créée ? ======
-La commande "Créer une Partition" peut être appliquée à un sous-corpus, mais elle produit un résultat incorrect si la structure utilisée pour définir la partition est au-dessus de la structure utilisée pour définir le sous-corpus. Exemples +La commande "Créer une Partition" peut être appliquée à un sous-corpus, mais elle produit un résultat incorrect si la structure utilisée pour définir la partition est **au-dessus de**((Équivalences terminologiques : une structure A contenant une structure B est “de niveau supérieur à“ la structure B ou “contient“ la structure B. Une structure B contenue par une structure A est “de niveau inférieur à“ la structure A ou “est contenue“ par la structure A)) la structure utilisée pour définir le sous-corpus. 
-  * sur un sous-corpus des entretiens réalisés auprès d'un interviewé ayant entre 38 et 50 ans, contraster les entretiens sur le sexe (homme / femme) : OK (structures de même niveau : c'est la même, ";text") + 
-  * sur un sous-corpus des entretiens réalisés auprès d'un interviewé ayant entre 38 et 50 ans, contraster les différentes parties des entretiens selon leur thématique : OK (la structure ayant servi à définir le sous-corpus, "text", contient la structure servant à définir la partition, "div"). +Soit un corpus d'entretiens (structure “text”) portant une information sur la tranche d'âge de la personne interviewée (propriété “agecla”, avec des valeurs de la forme “20-32”, “32-38”, etc.), ainsi que des informations sur les thématiques propres à chaque partie des entretiens, définies grâce à la structure “div” :  
-  * sur un sous-corpus constitué des parties d'entretien consacrées à la thématique "métier", contraster les entretiens suivant la tranche d'âge de l'interviewé : attention (la structure ayant servi à définir le sous-corpus, "div", est en dessous de la structure servant à définir la partition, "text").+ 
 +Dans ce corpus, on pourra sans difficulté :  
 +  * partitionner un sous-corpus d’entretiens réalisés auprès d'un interviewé ayant entre 38 et 50 ans, afin de faire contraster les entretiens sur le genre : cette opération ne pose aucune difficulté puisque les structures sont de **même niveau** (« text ») ;  
 +  * partitionner un sous-corpus d’entretiens réalisés auprès d'un interviewé ayant entre 38 et 50 ans, afin de faire contraster les différentes parties des entretiens selon leur thématique : cette opération ne posera aucune difficulté puisque la structure ayant servi à définir le sous-corpus (“text”) **contient** la structure servant à définir la partition (“div”).  
 + 
 +En revanche, vous devrez utiliser le mode avancé pour créer une partition si la structure utilisée pour la définir est **supérieure** à la structure utilisée pour définir le sous-corpus. Il faudra donc utiliser le mode avancé dans le cas où l’on souhaiterait, par exemple, partitionner un sous-corpus constitué des parties d'entretien consacrées à la thématique “métier” en vue de faire contraster les entretiens suivant la tranche d'âge de l'interviewé. En effet, dans ce cas, la structure utilisée pour définir le sous-corpus (“div”) est inférieure à la structure servant à définir la partition (“text”).
-Ce genre de partition est possible mais en mode avancé, dans le cas décrit les équations à entrer pour définir les différentes parties seraient +Dans le mode avancé, l’utilisateur aura ainsi à entrer les équations suivantes pour partitionner son corpus :  
-  * partie 1 : [_.text_agecla="20-32" & _.div_topic="métier"] expand to div +  * partie 1 : [_.text_agecla=“20-32” & _.div_topic=“métier”] expand to div 
-  * partie 2 : [_.text_agecla="32-38" & _.div_topic="métier"] expand to div +  * partie 2 : [_.text_agecla=“32-38” & _.div_topic=“métier”] expand to div\\ etc.
-  * etc.+
Rq. 1 : Cette partition est construite directement sur le corpus entier mais en fait ne couvre que le sous-corpus "métier" (qui n'est pas créé et n'apparaît pas au niveau de l'interface). On fait une exception en construisant une partition qui ne couvre pas tout le domaine sur lequel elle porte (corpus entier), son domaine effectif (métier) reste implicite. Rq. 1 : Cette partition est construite directement sur le corpus entier mais en fait ne couvre que le sous-corpus "métier" (qui n'est pas créé et n'apparaît pas au niveau de l'interface). On fait une exception en construisant une partition qui ne couvre pas tout le domaine sur lequel elle porte (corpus entier), son domaine effectif (métier) reste implicite.
public/faq.1543595872.txt.gz · Dernière modification: 2018/11/30 17:37 par slh@ens-lyon.fr