Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

public:faq [2018/12/13 15:29]
slh@ens-lyon.fr
public:faq [2019/02/12 18:14] (version actuelle)
slh@ens-lyon.fr
Ligne 1281: Ligne 1281:
==== sources XML-TEI ==== ==== sources XML-TEI ====
-Voir les [[https://groupes.renater.fr/wiki/txm-users/public/tutoriels_import_xml-tei|tutoriels dédiés XML-TEI]].+Voir les [[https://groupes.renater.fr/wiki/txm-users/public/tutoriels_import_xml-tei|tutoriels dédiés aux représentations XML-TEI]]
 + 
 +==== traitements de texte .DOCX, .ODT ==== 
 + 
 +Déposer les fichiers dans un répertoire et lui appliquer le module d'import [[http://textometrie.ens-lyon.fr/html/doc/manual/0.7.9/fr/manual26.xhtml#toc112|ODT/DOC/RTF+CSV]].  
 + 
 +Ou bien convertir d'abord les fichiers en fichiers en XML-TEI avec le service en ligne [[http://www.tei-c.org/oxgarage|OxGarage]], puis importer les fichiers au format XML avec le module XTZ+CSV. 
 + 
 +Ou bien convertir d'abord les fichiers en fichiers au format TXT avec la [[https://groupes.renater.fr/wiki/txm-users/public/macros#text2txt|macro Text2TXT]], puis importer les fichiers au format TXT avec le module TXT+CSV.
==== Europresse ==== ==== Europresse ====
Ligne 1354: Ligne 1362:
===== D. Données textuelles tabulées ===== ===== D. Données textuelles tabulées =====
-On peut importer des données textuelles enregistrées dans des tableaux MS Excel ou LibreOffice Calc en les convertissant en XML au préalable, puis en utilisant les modules d'import basés sur le format XML (XML/w+CSV ou XTZ+CSV par exemple).+On peut importer des données textuelles enregistrées dans des tableaux MS Excel ou LibreOffice Calc en les convertissant en XML au préalable, puis en utilisant les modules d'import basés sur le format XML (comme XML/w+CSV ou XTZ+CSV par exemple).
-Lors de la conversion, on choisira les colonnes qui deviendront des métadonnées de textes et les colonnes qui deviendront des sections de texte.+Lors de la conversion, on choisira les colonnes qui deviendront des métadonnées de texte et les colonnes qui deviendront des sections de texte.
==== CSV ==== ==== CSV ====
Ligne 1366: Ligne 1374:
Convertir les fichiers .xlsx en .xml avec la macro [[public:macros#excel2xml_exceldir2xml|macro Excel2XML]] ou ExcelDir2XML pour une conversion par lots. Convertir les fichiers .xlsx en .xml avec la macro [[public:macros#excel2xml_exceldir2xml|macro Excel2XML]] ou ExcelDir2XML pour une conversion par lots.
-Remarque : il est conseillé d'utiliser la macro Excel2XML plutôt que CSV2XML car le format est plus précis (moins de problèmes d'encodage de caractères, de carctère séparateur de colonnes, etc.) et Excel2XML offre plus de services.+Remarque : il est conseillé d'utiliser la macro Excel2XML plutôt que CSV2XML car le format .xlsx est plus précis (moins de problèmes d'encodage de caractères, de caractère séparateur de colonnes, etc.) et Excel2XML offre plus de services.
====== Après import, certains caractères de mes textes sont illisibles. Que se passe-t-il ? ====== ====== Après import, certains caractères de mes textes sont illisibles. Que se passe-t-il ? ======
Ligne 1739: Ligne 1747:
====== Je veux faire une partition sur un sous-corpus, mais c'est bizarre, certaines parties semblent avoir disparu, ou être vides, ou la partition n'est pas créée ? ====== ====== Je veux faire une partition sur un sous-corpus, mais c'est bizarre, certaines parties semblent avoir disparu, ou être vides, ou la partition n'est pas créée ? ======
-La commande "Créer une Partition" peut être appliquée à un sous-corpus, mais elle produit un résultat incorrect si la structure utilisée pour définir la partition est au-dessus de la structure utilisée pour définir le sous-corpus. Exemples +La commande "Créer une Partition" peut être appliquée à un sous-corpus, mais elle produit un résultat incorrect si la structure utilisée pour définir la partition est **au-dessus de**((Équivalences terminologiques : une structure A contenant une structure B est “de niveau supérieur à“ la structure B ou “contient“ la structure B. Une structure B contenue par une structure A est “de niveau inférieur à“ la structure A ou “est contenue“ par la structure A)) la structure utilisée pour définir le sous-corpus. 
-  * sur un sous-corpus des entretiens réalisés auprès d'un interviewé ayant entre 38 et 50 ans, contraster les entretiens sur le sexe (homme / femme) : OK (structures de même niveau : c'est la même, ";text") + 
-  * sur un sous-corpus des entretiens réalisés auprès d'un interviewé ayant entre 38 et 50 ans, contraster les différentes parties des entretiens selon leur thématique : OK (la structure ayant servi à définir le sous-corpus, "text", contient la structure servant à définir la partition, "div"). +Soit un corpus d'entretiens (structure “text”) portant une information sur la tranche d'âge de la personne interviewée (propriété “agecla”, avec des valeurs de la forme “20-32”, “32-38”, etc.), ainsi que des informations sur les thématiques propres à chaque partie des entretiens, définies grâce à la structure “div” :  
-  * sur un sous-corpus constitué des parties d'entretien consacrées à la thématique "métier", contraster les entretiens suivant la tranche d'âge de l'interviewé : attention (la structure ayant servi à définir le sous-corpus, "div", est en dessous de la structure servant à définir la partition, "text").+ 
 +Dans ce corpus, on pourra sans difficulté :  
 +  * partitionner un sous-corpus d’entretiens réalisés auprès d'un interviewé ayant entre 38 et 50 ans, afin de faire contraster les entretiens sur le genre : cette opération ne pose aucune difficulté puisque les structures sont de **même niveau** (« text ») ;  
 +  * partitionner un sous-corpus d’entretiens réalisés auprès d'un interviewé ayant entre 38 et 50 ans, afin de faire contraster les différentes parties des entretiens selon leur thématique : cette opération ne posera aucune difficulté puisque la structure ayant servi à définir le sous-corpus (“text”) **contient** la structure servant à définir la partition (“div”).  
 + 
 +En revanche, vous devrez utiliser le mode avancé pour créer une partition si la structure utilisée pour la définir est **supérieure** à la structure utilisée pour définir le sous-corpus. Il faudra donc utiliser le mode avancé dans le cas où l’on souhaiterait, par exemple, partitionner un sous-corpus constitué des parties d'entretien consacrées à la thématique “métier” en vue de faire contraster les entretiens suivant la tranche d'âge de l'interviewé. En effet, dans ce cas, la structure utilisée pour définir le sous-corpus (“div”) est inférieure à la structure servant à définir la partition (“text”).
-Ce genre de partition est possible mais en mode avancé, dans le cas décrit les équations à entrer pour définir les différentes parties seraient +Dans le mode avancé, l’utilisateur aura ainsi à entrer les équations suivantes pour partitionner son corpus :  
-  * partie 1 : [_.text_agecla="20-32" & _.div_topic="métier"] expand to div +  * partie 1 : [_.text_agecla=“20-32” & _.div_topic=“métier”] expand to div 
-  * partie 2 : [_.text_agecla="32-38" & _.div_topic="métier"] expand to div +  * partie 2 : [_.text_agecla=“32-38” & _.div_topic=“métier”] expand to div\\ etc.
-  * etc.+
Rq. 1 : Cette partition est construite directement sur le corpus entier mais en fait ne couvre que le sous-corpus "métier" (qui n'est pas créé et n'apparaît pas au niveau de l'interface). On fait une exception en construisant une partition qui ne couvre pas tout le domaine sur lequel elle porte (corpus entier), son domaine effectif (métier) reste implicite. Rq. 1 : Cette partition est construite directement sur le corpus entier mais en fait ne couvre que le sous-corpus "métier" (qui n'est pas créé et n'apparaît pas au niveau de l'interface). On fait une exception en construisant une partition qui ne couvre pas tout le domaine sur lequel elle porte (corpus entier), son domaine effectif (métier) reste implicite.
public/faq.1544711340.txt.gz · Dernière modification: 2018/12/13 15:29 par slh@ens-lyon.fr