Outils pour utilisateurs

Outils du site


public:faq

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:faq [2017/05/17 10:56]
charles.bourdot@ens-lyon.fr
public:faq [2017/05/17 10:58] (Version actuelle)
charles.bourdot@ens-lyon.fr
Ligne 1: Ligne 1:
-===== Comment importer un corpus dans TXM ? =====+====== Comment importer un corpus dans TXM ? ======
  
-Le plus simple est de sélectionner puis de copier (dans le presse-papier) le texte à importer dans l'​outil de votre choix (traitement de texte, navigateur, etc.), puis depuis TXM lancer la commande '​Fichier > Importer > Presse-papier'​. Une nouvelle icone de corpus apparaît dans la vue des corpus située à gauche de l'​interface qui permet de lui appliquer les outils de TXM. Remarque : dans l'​import par le presse-papier,​ la langue utilisée pour la lemmatisation à la volée est réglée par la préférence '​Outils > Préférences / TXM / Utilisateur / Import : Default language'​.+Le plus simple est de sélectionner puis de copier (dans le presse-papier) le texte à importer dans l'​outil de votre choix (traitement de texte, navigateur, etc.), puis depuis TXM lancer la commande '​Fichier > Importer > **Presse-papier**'. Une nouvelle icone de corpus apparaît dans la vue des corpus située à gauche de l'​interface qui permet de lui appliquer les outils de TXM. Remarque : dans l'​import par le presse-papier,​ la langue utilisée pour la lemmatisation à la volée est réglée par la préférence '​Outils > Préférences / TXM / Utilisateur / Import : Default language'​.
  
 Pour importer un ou plusieurs fichiers dans un format spécifique,​ voici les différentes options disponibles. Pour importer un ou plusieurs fichiers dans un format spécifique,​ voici les différentes options disponibles.
  
 +===== A. Textes écrits =====
  
-==== A. Textes écrits ​====+==== formats TXT et XML ====
  
 +  * TXT : déposer les fichiers source au format TXT dans un répertoire et appliquer le module d'​import '​Fichier > Importer > **TXT+CSV**'​ sur le répertoire.
 +  * XML : déposer les fichiers source au format XML dans un répertoire et appliquer le module d'​import '​Fichier > Importer > **XML/​w+CSV**'​ sur le répertoire.
  
-=== formats TXT et XML ===+Comme pour tous les modules d'​import,​ vous pouvez de façon optionnelle associer des propriétés à chaque texte (auteur, titre, genre, date...) en déposant un fichier '​metadata.csv'​ au format CSV dans le répertoire des sources (voir la documentation de ces modules pour le format précis de ce fichier).
  
-TXT : déposer les fichiers source au format TXT dans un répertoire et appliquer le module d'​import '​Fichier > Importer > TXT+CSV'​ sur le répertoire. +Pour vous aider à choisir le format source le plus adapté à votre travail, nous vous invitons à suivre la séquence du tutoriel ​[[https://​sourceforge.net/​projects/​txm/​files/​course%20materials/​Support%20-%20Atelier%20preparation%20de%20corpus%20et%20import%20dans%20TXM.pdf/​download|Support - Atelier preparation de corpus et import dans TXM.pdf'​]] qui utilise des fichiers texte exemples fournis dans l'​archive support ​[[https://​sourceforge.net/​projects/​txm/​files/​course%20materials/​PreparationEtImportDansTXM.zip/​download|PreparationEtImportDansTXM.zip]].
-XML : déposer les fichiers source au format XML dans un répertoire et appliquer le module d'​import '​Fichier > Importer > XML/​w+CSV'​ sur le répertoire. +
-Comme pour tous les modules d'​import,​ vous pouvez de façon optionnelle associer des propriétés à chaque texte (auteur, titre, genre, date…) en déposant un fichier '​metadata.csv'​ au format CSV dans le répertoire des sources (voir la documentation de ces modules pour le format précis de ce fichier). +
- +
-Pour vous aider à choisir le format source le plus adapté à votre travail, nous vous invitons à suivre la séquence du tutoriel Support - Atelier preparation de corpus et import dans TXM.pdf'​ qui utilise des fichiers texte exemples fournis dans l'​archive support PreparationEtImportDansTXM.zip.+
  
 Cette séquence vous montrera comment choisir au mieux le niveau de représentation de vos textes sources en fonction des services dont vous voulez bénéficier au sein de la plateforme TXM : TXM est conçu pour vous aider à importer progressivement vos corpus, d'une représentation minimaliste à la plus évoluée, pour vous aider à gérer au mieux le coût de préparation de vos sources en fonction du temps dont vous disposez. Cette séquence vous montrera comment choisir au mieux le niveau de représentation de vos textes sources en fonction des services dont vous voulez bénéficier au sein de la plateforme TXM : TXM est conçu pour vous aider à importer progressivement vos corpus, d'une représentation minimaliste à la plus évoluée, pour vous aider à gérer au mieux le coût de préparation de vos sources en fonction du temps dont vous disposez.
  
-Voir également le Tutoriel pour importer des textes bruts (ou 'plain text') dans TXM.+Voir également le [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​tutoriel_import_txt_csv|Tutoriel pour importer des textes bruts (ou 'plain text') dans TXM]].
  
-Pour les conversions depuis de nombreux formats de textes vers TXT et XML, nous vous recommandons d'​utiliser le service de conversion OxGarage.+Pour les conversions depuis de nombreux formats de textes vers TXT et XML, nous vous recommandons d'​utiliser le service de conversion ​[[http://​www.tei-c.org/​oxgarage|OxGarage]].
  
 +==== sources XML-TEI ====
  
-sources ​XML-TEI+Voir les [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​tutoriels_import_xml-tei|tutoriels dédiés ​XML-TEI]].
  
-Voir les tutoriels dédiés XML-TEI.+==== Europresse ====
  
 +Voir le [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​tutoriel_europresse|tutoriel d'​importation de corpus d'​articles exportés du portail EUROPRESS dans TXM]].
  
-Europresse +==== Factiva ​====
- +
-Voir le tutoriel d'​importation de corpus d'​articles exportés du portail EUROPRESS dans TXM. +
- +
- +
-Factiva+
  
 Déposer les fichiers exportés au format XML dans un répertoire et lui appliquer le module d'​import 'XML Factiva'​. Déposer les fichiers exportés au format XML dans un répertoire et lui appliquer le module d'​import 'XML Factiva'​.
Ligne 40: Ligne 36:
 Déposer les fichiers exportés au format TXT (mail) dans un répertoire et lui appliquer le module d'​import '​Factiva TXT'. Déposer les fichiers exportés au format TXT (mail) dans un répertoire et lui appliquer le module d'​import '​Factiva TXT'.
  
- +==== Hyperbase ​====
-Hyperbase+
  
 Déposer le fichier dans un répertoire et lui appliquer le module d'​import '​Hyperbase'​. Déposer le fichier dans un répertoire et lui appliquer le module d'​import '​Hyperbase'​.
  
- +==== Iramuteq, Alceste ​====
-Iramuteq, Alceste+
  
 Déposer le fichier dans un répertoire et lui appliquer le module d'​import '​Alceste'​. Déposer le fichier dans un répertoire et lui appliquer le module d'​import '​Alceste'​.
  
- +==== Cordial ​====
-Cordial+
  
 Déposer les fichiers au format CNR dans un répertoire et lui appliquer le module d'​import '​CNR+CSV'​. Déposer les fichiers au format CNR dans un répertoire et lui appliquer le module d'​import '​CNR+CSV'​.
  
 +==== PDF ====
  
-PDF+Voir la question [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​faq#​peut_on_importer_des_documents_au_format_pdf_dans_txm|peut on importer des documents au format ​PDF dans TXM ?]]
  
-Voir la question peut on importer des documents au format PDF dans TXM ?+==== pages web (HTML) ====
  
 +Voir la question [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​faq#​comment_faire_pour_importer_des_pages_web_dans_txm|comment faire pour importer des pages web dans TXM ?]]
  
-pages web (HTML)+Pour l'​aspiration de pages web, nous vous recommandons d'​utiliser le logiciel [[http://​gromoteur.ilpga.fr|gromoteur]].
  
-Voir la question comment faire pour importer des pages web dans TXM ? +==== EPub ====
- +
-Pour l'​aspiration de pages web, nous vous recommandons d'​utiliser le logiciel gromoteur. +
- +
- +
-EPub+
  
 TXM n'​importe pas actuellement de fichiers EPub directement. TXM n'​importe pas actuellement de fichiers EPub directement.
  
-Nous vous recommandons d'​utiliser le logiciel Calibre pour en extraire une représentation HTML puis d'​utiliser le logiciel Tidy pour obtenir du XHTML à importer avec le module d'​import XML/w+CSV. Vous pouvez également extraire une représentation .TXT et utiliser le module d'​import TXT+CSV. +Nous vous recommandons d'​utiliser le logiciel ​[[https://​calibre-ebook.com|Calibre]] pour en extraire 
- +une représentation HTML puis d'​utiliser le logiciel ​[[http://​www.html-tidy.org/​|Tidy]] pour obtenir du XHTML 
-Remarque : le logiciel <​oXygen/>​ permet également de manipuler des fichiers EPub. +à importer avec le module d'​import XML/w+CSV. Vous pouvez également extraire une représentation .TXT et utiliser le module d'​import TXT+CSV.
- +
- +
-==== B. Transcriptions d'​enregistrements ==== +
- +
- +
-Transcriber,​ .ODT, .DOC, .RTF, .TXT+
  
-Déposer les fichiers au format .TRS (saisis avec le logiciel ​Transcriber) dans un répertoire et lui appliquer le module d'​import 'XML Transcriber+CSV'​.+Remarque : le logiciel ​[[http://​www.oxygenxml.com/​xml_editor/​epub.html|<​oXygen/>​]] permet également de manipuler des 
 +fichiers EPub.
  
-Vous pouvez également saisir vos transcriptions directement dans un traitement de texte (Word ou équivalent) en respectant des conventions de transcription élémentaires puis les importer dans TXM après conversion automatiqueVoir le tutoriel pour l'​import de transcriptions basé sur le module ​d'import 'XML Transcriber+CSV'​.+===== BTranscriptions ​d'enregistrements =====
  
 +==== Transcriber,​ .ODT, .DOC, .RTF, .TXT ====
  
-ELAN, CLAN, Praat+Déposer les fichiers au format .TRS (saisis avec le logiciel Transcriber) dans un répertoire et lui appliquer le module d'​import 'XML Transcriber+CSV'​. ​
  
-Nous vous recommandons ​de convertir les fichiers source vers le format Transcriber ​(ou .TRSà l'aide du convertisseur TEI_CORPO puis d'​utiliser ​le module d'​import 'XML Transcriber+CSV'​.+Vous pouvez également saisir vos transcriptions directement dans un traitement ​de texte (Word ou équivalenten respectant des conventions de transcription élémentaires puis les importer dans TXM après conversion automatique. Voir le [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​tutoriel_import_transcriptions|tutoriel pour l'import de transcriptions]] basé sur le module d'​import 'XML Transcriber+CSV'​.
  
 +==== ELAN, CLAN, Praat ====
  
-==== CCorpus multilingues alignés ====+Nous vous recommandons de convertir les fichiers source vers le format Transcriber (ou .TRS) à l'aide du [[http://​ct3.ortolang.fr/​teiconvert|convertisseur TEI_CORPO]] puis d'​utiliser le module d'​import 'XML Transcriber+CSV'​.
  
 +===== C. Corpus multilingues alignés =====
  
-TMX+==== TMX ====
  
 Déposer les fichiers au format TMX dans un répertoire et lui appliquer le module d'​import '​XML-TMX'​. Déposer les fichiers au format TMX dans un répertoire et lui appliquer le module d'​import '​XML-TMX'​.
  
-On peut tester avec le corpus exemple '​uno-tmx-sample-src.zip'​.+On peut tester avec le corpus exemple '[[https://​sourceforge.net/​projects/​txm/​files/​corpora/​uno-tmx-sample/​uno-tmx-sample-src.zip/​download|uno-tmx-sample-src.zip]]'.
public/faq.txt · Dernière modification: 2017/05/17 10:58 par charles.bourdot@ens-lyon.fr