Outils pour utilisateurs

Outils du site


public:antract:antract_corpus_notices

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
public:antract:antract_corpus_notices [2021/10/05 14:33]
matthieu.decorde@ens-lyon.fr [Version 3]
public:antract:antract_corpus_notices [2021/10/11 17:38] (Version actuelle)
benedicte.pincemin@ens-lyon.fr
Ligne 399: Ligne 399:
 <​note>​Attention de bien copier les espaces dans certaines valeurs de paramètres de la macro. Par exemple le nom de la colonne '​Nature de production'​ contient bien un espace à la fin.</​note> ​ <​note>​Attention de bien copier les espaces dans certaines valeurs de paramètres de la macro. Par exemple le nom de la colonne '​Nature de production'​ contient bien un espace à la fin.</​note> ​
   * A) préparer les sources pour l'​import XTZ   * A) préparer les sources pour l'​import XTZ
-    * récupérer la version la plus récente et corrigée du fichiers Excel des notices 'ANTRACT_AF_Notices_3oct19_corrige_pour_12nov1953.xlsx' dans le répertoire Sharedocs '​[[https://​sharedocs.huma-num.fr/​index.php/​f/​20677873|ANR > ANTRACT > SP2 Corpus & Recherche technologique > TXM > corpus > notices documentaires > version3 > src]]'+    * récupérer la version la plus récente et corrigée du fichiers Excel des notices 'ANTRACT_AF_Notices_3oct21_2.xlsx' dans le répertoire Sharedocs '​[[https://​sharedocs.huma-num.fr/​index.php/​f/​20677873|ANR > ANTRACT > SP2 Corpus & Recherche technologique > TXM > corpus > notices documentaires > version3 > src]]'
     * récupérer la dernière version de la macro table/​Table2XML depuis les sources de TXM https://​forge.cbp.ens-lyon.fr/​svn/​txm/​tmp/​org.txm.groovy.core/​src/​groovy/​org/​txm/​macro/​table/​Table2XMLMacro.groovy <​del>​ou installer TXM 0.8.2</​del>​ [plus tard]     * récupérer la dernière version de la macro table/​Table2XML depuis les sources de TXM https://​forge.cbp.ens-lyon.fr/​svn/​txm/​tmp/​org.txm.groovy.core/​src/​groovy/​org/​txm/​macro/​table/​Table2XMLMacro.groovy <​del>​ou installer TXM 0.8.2</​del>​ [plus tard]
     * depuis TXM 0.8.1, lancer la macro Table2XML avec les paramètres suivants :     * depuis TXM 0.8.1, lancer la macro Table2XML avec les paramètres suivants :
-      * inputFile : chemin vers ANTRACT_AF_Notices_3oct19_corrige_pour_12nov1953.xlsx+      * inputFile : chemin vers ANTRACT_AF_Notices_3oct21_2.xlsx
       * outputDirectory : répertoire où seront créés les fichiers XML résultats (futur répertoire à importer par XTZ)       * outputDirectory : répertoire où seront créés les fichiers XML résultats (futur répertoire à importer par XTZ)
       * textIDColumn : Identifiant de la notice       * textIDColumn : Identifiant de la notice
Ligne 423: Ligne 423:
       * debug : %%<​décoché>​%%\\ -> les sources .xml sont produites dans le répertoire de sortie ; 1 émission ne contenant aucun sujet, donc aucun mot, a été ignorée.       * debug : %%<​décoché>​%%\\ -> les sources .xml sont produites dans le répertoire de sortie ; 1 émission ne contenant aucun sujet, donc aucun mot, a été ignorée.
   * B) importer les sources par XTZ pour construire le corpus AF-NOTICES-V3   * B) importer les sources par XTZ pour construire le corpus AF-NOTICES-V3
-    * copier ​les répertoires sources **css** et **xsl** depuis le répertoire Sharedocs '​[[https://​sharedocs.huma-num.fr/​index.php/​f/​20677873|ANR > ANTRACT > SP2 Corpus & Recherche technologique > TXM > corpus > notices documentaires > version3 > src]]' dans le répertoire de sortie ([BP, 2021-09-30 je vais tester une nouvelle version de la feuille XSL pour régler ​les références ​de concordance avec la date du text plutôt que celle de la div])+    * copier ​la dernière version des répertoires sources **css** et **xsl** depuis le répertoire Sharedocs '​[[https://​sharedocs.huma-num.fr/​index.php/​f/​20677873|ANR > ANTRACT > SP2 Corpus & Recherche technologique > TXM > corpus > notices documentaires > version3 > src]]' dans le répertoire de sortie (BP, 2021-10-11 il y a eu des derniers réglages dans ces fichiers ​pour : (i) avec dans les références ​les dates des émissions ​plutôt que celles des sujets, et (ii) avoir à la fois les propriétés id et identifiant-de-la-notice sur les div).
     * lancer l'​import XTZ sur le répertoire de sortie     * lancer l'​import XTZ sur le répertoire de sortie
       * les paramètres spécifiques sont :       * les paramètres spécifiques sont :
public/antract/antract_corpus_notices.txt · Dernière modification: 2021/10/11 17:38 par benedicte.pincemin@ens-lyon.fr