Outils pour utilisateurs

Outils du site


public:import_tiger

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:import_tiger [2018/04/05 11:02]
slh@ens-lyon.fr
public:import_tiger [2019/06/05 09:51] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 32: Ligne 32:
 L'​import peut être réalisé en suivant la [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​extensions_alpha#​tigersearch | procédure d'​import d'un fichier au format TIGER-XML]] décrite dans la documentation de l'​extension TIGERSearch. L'​import peut être réalisé en suivant la [[https://​groupes.renater.fr/​wiki/​txm-users/​public/​extensions_alpha#​tigersearch | procédure d'​import d'un fichier au format TIGER-XML]] décrite dans la documentation de l'​extension TIGERSearch.
  
-==== Version ​finale ​====+==== Version ​==== 
 + 
 +L'​extension TIGERSearch rajoute un module d'​import XML-TS + CSV (le script tigersearchLoader.groovy est copié dans le répertoire TXMHOME/​scripts/​import). 
 + 
 +Le module prend en entrée un répertoire contenant un corpus source au format [[http://​www.ims.uni-stuttgart.de/​forschung/​ressourcen/​werkzeuge/​TIGERSearch/​doc/​html/​TigerXML.html|TIGER XML]] sans sous-corpus : un seul texte dans un seul fichier TIGER XML. 
 + 
 +Le module fait un import XTZ sur le fichier résultat de l'​application de la feuille XSL "​ts.xsl"​ puis indexe un corpus TIGER dans le répertoire "​tiger"​ du corpus binaire produit. 
 + 
 +==== Version 2 ==== 
 + 
 +Variante gérant plusieurs textes à l'aide d'un fichier main.xml à côté des fichiers TIGER XML de chaque texte. 
 + 
 +L'​ordre des textes dans le corpus TIGER et le corpus CQP doivent être les mêmes. 
  
 ===== Recette ===== ===== Recette =====
Ligne 58: Ligne 71:
 === B. Indexation du texte CORPUS110CYL067.xml au format TIGER-XML avec TIGERRegistry === === B. Indexation du texte CORPUS110CYL067.xml au format TIGER-XML avec TIGERRegistry ===
  
-  * si nécessaire,​ lancer TIGERRegistry +  * sélectionner le répertoire CorporaDir 
-    * insérer le texte CORPUS110CYL067.xml avec '​Corpus/​Insert Corpus'​ +  * insérer le texte CORPUS110CYL067.xml avec '​Corpus/​Insert Corpus'​ 
-      * Corpus ID : CORPUS110CYL067+    *  
 +    ​* Corpus ID : CORPUS110CYL067
  
 === C. préparation du répertoire source en TIGER-XML pour TXM === === C. préparation du répertoire source en TIGER-XML pour TXM ===
public/import_tiger.1522918969.txt.gz · Dernière modification: 2018/04/05 11:02 par slh@ens-lyon.fr