Outils pour utilisateurs

Outils du site


public:faq

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:faq [2019/06/12 13:44]
matthieu.decorde@ens-lyon.fr [Installation et mises à jour]
public:faq [2019/07/01 17:19] (Version actuelle)
slh@ens-lyon.fr [formats TXT et XML]
Ligne 1316: Ligne 1316:
 ==== formats TXT et XML ==== ==== formats TXT et XML ====
  
 +TXT correspond au format texte brut ou "texte au kilomètre",​ composé seulement de caractères,​ d'​espaces et de sauts de lignes. C'est le format textuel le plus simple.
 +
 +XML correspond au format texte structuré à l'aide de balises xml, selon une syntaxe stricte.
 +
 +Chaque format dispose de son propre module d'​import :
   * TXT : déposer les fichiers source au format TXT dans un répertoire et appliquer le module d'​import '​Fichier > Importer > **TXT+CSV**'​ sur le répertoire.   * TXT : déposer les fichiers source au format TXT dans un répertoire et appliquer le module d'​import '​Fichier > Importer > **TXT+CSV**'​ sur le répertoire.
   * XML : déposer les fichiers source au format XML dans un répertoire et appliquer le module d'​import '​Fichier > Importer > **XML/​w+CSV**'​ sur le répertoire.   * XML : déposer les fichiers source au format XML dans un répertoire et appliquer le module d'​import '​Fichier > Importer > **XML/​w+CSV**'​ sur le répertoire.
Ligne 1323: Ligne 1328:
 Pour vous aider à choisir le format source le plus adapté à votre travail, nous vous invitons à suivre la séquence du tutoriel [[https://​sourceforge.net/​projects/​txm/​files/​course%20materials/​Support%20-%20Atelier%20preparation%20de%20corpus%20et%20import%20dans%20TXM.pdf/​download|Support - Atelier preparation de corpus et import dans TXM.pdf'​]] qui utilise des fichiers texte exemples fournis dans l'​archive support [[https://​sourceforge.net/​projects/​txm/​files/​course%20materials/​PreparationEtImportDansTXM.zip/​download|PreparationEtImportDansTXM.zip]]. Pour vous aider à choisir le format source le plus adapté à votre travail, nous vous invitons à suivre la séquence du tutoriel [[https://​sourceforge.net/​projects/​txm/​files/​course%20materials/​Support%20-%20Atelier%20preparation%20de%20corpus%20et%20import%20dans%20TXM.pdf/​download|Support - Atelier preparation de corpus et import dans TXM.pdf'​]] qui utilise des fichiers texte exemples fournis dans l'​archive support [[https://​sourceforge.net/​projects/​txm/​files/​course%20materials/​PreparationEtImportDansTXM.zip/​download|PreparationEtImportDansTXM.zip]].
  
-Cette séquence vous montrera comment choisir au mieux le niveau de représentation de vos textes sources en fonction des services dont vous voulez bénéficier au sein de la plateforme TXM TXM est conçu pour vous aider à importer progressivement vos corpus, d'une représentation minimaliste à la plus évoluée, pour vous aider à gérer au mieux le coût de préparation de vos sources en fonction du temps dont vous disposez.+Cette séquence vous montrera comment choisir au mieux le niveau de représentation de vos textes sources en fonction des services dont vous voulez bénéficier au sein de la plateforme TXMTXM est conçu pour vous aider à importer progressivement vos corpus, d'une représentation minimaliste à la plus évoluée, pour vous aider à gérer au mieux le coût de préparation de vos sources en fonction du temps dont vous disposez ​
 +  - format texte brut (TXT) 
 +  - format texte brut (TXT) avec métadonnées de textes (CSV) 
 +  - format xml (XML) 
 +  - format xml (XML) avec métadonnées de textes (CSV) 
 +  - format xml (XML) avec structures xml supplémentaires (paragraphes) 
 +  - format xml (XML) avec structures xml ayant des propriétés 
 +  - format xml (XML) avec pré-encodage de certains mots 
 +  - format xml (XML) avec pré-encodage de certains mots ayant des propriétés
  
 Voir également le [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​tutoriel_import_txt_csv|Tutoriel pour importer des textes bruts (ou 'plain text') dans TXM]]. Voir également le [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​tutoriel_import_txt_csv|Tutoriel pour importer des textes bruts (ou 'plain text') dans TXM]].
public/faq.1560339891.txt.gz · Dernière modification: 2019/06/12 13:44 par matthieu.decorde@ens-lyon.fr