Outils pour utilisateurs

Outils du site


public:xsl

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:xsl [2013/12/07 18:30]
slh@ens-lyon.fr
public:xsl [2019/07/10 10:02] (Version actuelle)
alexei.lavrentev@ens-lyon.fr [2-front step]
Ligne 11: Ligne 11:
   * les auteurs et les licences de diffusion des feuilles XSL sont indiqués au sein de chaque feuille.   * les auteurs et les licences de diffusion des feuilles XSL sont indiqués au sein de chaque feuille.
  
-===== Feuilles génériques élémentaires de filtrage de sources XML ===== 
  
-  ​* **filter-out-p.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <p> ayant un attribut '​type'​ à la valeur '​ouverture'​ (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'​import XML/w+CSV pour filtrer différentes balises XML à la volée ; +===== Feuilles de style destinées à l'​usage avec le module d'​import XTZ+CSV ===== 
-  * **filter-out-sp.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <sp> ayant un attribut '​who'​ à la valeur '​enqueteur'​ (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'​import Transcriber+CSV pour filtrer ​différentes ​prises de tour à la volée.+ 
 +==== 1-split-merge step ==== 
 + 
 +=== txm-rename-files-no-dots.xsl === 
 +This stylesheet is designed for TXM XTZ+CSV import module to replace dots with underscores in source file names. (A bug in TXM 0.7.8 prevents 
 +files containing dots in their names from being imported). 
 + 
 +=== txm-split-teicorpus.xsl === 
 +This stylesheet may be used to split a single file containing a teiCorpus into individual files for each TEI child. 
 + 
 +==== 2-front step ==== 
 + 
 +=== txm-front-teiHeader2textAtt.xsl === 
 + 
 +This stylesheet may be customized to extract metadata from teiHeader and create corresponding attributes of the text element. 
 + 
 +=== txm-front-teitxm2xmlw.xsl === 
 + 
 +This stylesheet may be used to import TEI-TXM XML files with XML-TEI Zero+CSV (or XML/W + CSV) module. This module is more flexible than XML-TEI TXM. It allows re-tokenizing the texts, selecting and renaming annotations,​ and building synoptic editions. 
 + 
 +==== 3-posttok step ==== 
 + 
 +=== txm-posttok-addRef.xsl === 
 + 
 +This stylesheet may be customized to add a ref attribute du w elements which will be used as a default reference in TXM concordances. 
 + 
 +=== txm-posttok-unbreakWords.xsl === 
 + 
 +This stylesheet may be customized to re-unite the words broken in the primary tokenization process (due to line or page breaks, for instance) 
 + 
 +==== 4-edition step ==== 
 + 
 +=== 1-default-html.xsl === 
 + 
 +This is an alternative stylesheet for creating default editions with the XTZ module. It transforms every TEI element into an HTML span with @class. This stylesheet must be used in conjunction with 2-default-pager.xsl. 
 + 
 +=== 2-defaut-pager.xsl === 
 + 
 +This stylesheet should be used in conjunction with 1-default-html.xsl to create edition pages. 
 + 
 + 
 +===== Feuilles génériques élémentaires de traitement de sources XML ===== 
 + 
 +  * **filter-keep-only-select.xsl** : cette feuille de transformation supprime le contenu de tous les éléments XML à l'​exception de <​select>​ et de ses descendants (voir la ligne 43). Si le document ne contient pas de balise <​select>,​ aucune modification n'est effectuée. Elle peut être adaptée et utilisée avec le module d'​import XML/w+CSV pour limiter le corpus aux éléments préannotés ; 
 +  ​* **filter-out-p.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <p> ayant un attribut '​type'​ à la valeur '​ouverture'​ (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'​import XML/w+CSV pour filtrer ​le contenu de différentes balises XML à la volée ; 
 +  * **filter-out-sp.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <sp> ayant un attribut '​who'​ à la valeur '​enqueteur'​ (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'​import Transcriber+CSV pour filtrer ​les prises de tour de différents locuteurs ​à la volée
 +  * **filter-number-act-scene-line.xsl** : cette feuille de transformation numérote tous les actes, scènes et lignes de l'​édition XML de la pièce All's Well That Ends Well de William Shakespeare publiée en ligne [[https://​www.ibiblio.org/​xml/​examples/​shakespeare/​all_well.xml]]. 
 +    * Elle peut être utilisée avec le module d'​import XML/w+CSV pour numéroter à la volée lors de l'​import. **Attention** : le pré-traitement XSL est plus strict (moins permissif) que le reste du module XML/w+CSV. Il faudra donc au préalable déposer dans le répertoire contenant la pièce le fichier de DTD correspondant disponible en ligne [[http://​www.ibiblio.org/​xml/​examples/​play.dtd]]. 
 +    * Elle peut également être appliquée de façon définitive sur la pièce au préalable, avant import, avec l'aide de la macro [[public:​macros#​execxsl|ExecXSL]].
  
 ===== Feuilles génériques d'​adaptation de sources XML-TEI P5 ===== ===== Feuilles génériques d'​adaptation de sources XML-TEI P5 =====
  
-  * **tei-filter-teip5-teibfm.xsl** : cette feuille de transformation peut être adaptée pour prétraiter n'​importe quel document au format XML-TEI P5 pour un import avec le module TEI BFM +  * **txm-filter-teip5-teibfm.xsl** : cette feuille de transformation peut être adaptée pour prétraiter n'​importe quel document au format XML-TEI P5 pour un import avec le module TEI BFM 
-  * **tei-filter-teip5-xmlw-preserve.xsl** : cette feuille de transformation peut être adaptée pour prétraiter ​n'​importe quel document au format XML-TEI P5 pour un import avec le module XML/w+CSV. Par défaut, elle supprime le contenu des éléments <​teiHeader>​ et <​facsimile>​ et laisse tous les autres éléments inchangés +  * **txm-filter-teip5-xmlw-preserve.xsl** : rend compatible ​n'​importe quel document au format XML-TEI P5 pour un import ​dans TXM avec le module XML/w+CSV. Par défaut, elle supprime le contenu des éléments <​teiHeader>​ et <​facsimile>​ et laisse tous les autres éléments inchangés 
-  * **tei-filter-teip5-xmlw-simplify.xsl** : cette feuille de transformation peut être adaptée pour prétraiter ​n'​importe quel document au format XML-TEI P5 pour un import avec le module XML/w+CSV. Par défaut : +    * Il est possible d'​appliquer cette feuille de style avec les paramètres suivants : 
-    * elle supprime le contenu de tous les éléments ​<teiHeader>, <facsimile> et <note+       * deleteAll : liste des noms de balises à supprimer avec leur contenu, les noms sont séparés pas des barres verticales (teiHeader|facsimile par défaut) 
-    * elle filtre tous les éléments du corps du texte (<​body>​exceptés ​ab, bodydivfrontlbppbsTEItext et w.+       * deleteTag : liste des noms de balises à supprimer en conservant leur contenu, les noms sont séparés pas des barres verticales (liste vide par défaut) 
 +  * **txm-filter-teip5-xmlw-simplify.xsl** : rend compatible ​n'​importe quel document au format XML-TEI P5 pour un import ​dans TXM avec le module XML/​w+CSV ​en ne gardant que les balises ​<ab>, <body>, <​div>,​ <​front>,​ <lb>, <p>, <pb>, <s>, <​TEI>,​ <text> et <wdans le corps du texte. 
 +    * Il est possible d'​appliquer cette feuille de style avec les paramètres suivants : 
 +       * deleteAll : liste des balises à supprimer avec leur contenu, les noms des balises sont séparés pas des barres verticales ​(teiHeader|facsimile par défaut) 
 +       * copyAll ​liste des balises à conserverles noms des balises sont séparés pas des barres verticales (ab|body|div|front|head|lb|p|pb|s|TEI|text|par défaut) ; 
 +    * Toutes les autres balises sont supprimées,​ leur contenu textuel est en revanche conservé. 
 +  * **txm-filter-bnc_oral-xmlw.xsl** : adapte les transcriptions de l'oral du BNC pour un traitement dans TXM. 
 +    * Projete dans des attributs de balise <div> le contenu de certaines métadonnées du teiHeader (pour faciliter les contrastes internes entre types d'​activités) : 
 +      * titleStmt/​title 
 +      * profileDesc/​creation 
 +      * classCode[@scheme='​DLEE'​] 
 +      * setting/​placeName 
 +      * setting/​locale 
 +      * setting/​activity 
 +      * setting/​activity/​@spont 
 +      * recording/​@date ou profileDesc/​creation 
 +    * Projete dans des attributs de balise <u> le contenu de certaines métadonnées du teiHeader (pour faciliter les contrastes internes entre types de locuteurs) : 
 +      * profileDesc/​particDesc/​person[...]/​@*
  
 ===== Feuilles spécialisées pour traiter un corpus particulier ===== ===== Feuilles spécialisées pour traiter un corpus particulier =====
Ligne 30: Ligne 94:
   * **txm-filter-teifrantext-teibfm.xsl** : conversion préalable des fichiers XML de la base [[http://​www.cnrtl.fr/​corpus/​frantext|Frantext libre]] pour le module d'​import TEI BFM (experimental : cette feuille ne fonctionnera pas correctement pour les documents ne suivant pas les recommandations d'​encodage des fichiers XML-TEI de la BFM)   * **txm-filter-teifrantext-teibfm.xsl** : conversion préalable des fichiers XML de la base [[http://​www.cnrtl.fr/​corpus/​frantext|Frantext libre]] pour le module d'​import TEI BFM (experimental : cette feuille ne fonctionnera pas correctement pour les documents ne suivant pas les recommandations d'​encodage des fichiers XML-TEI de la BFM)
   * **txm-filter-teifrantext-xmlw.xsl** : conversion préalable des fichiers XML de la base [[http://​www.cnrtl.fr/​corpus/​frantext|Frantext libre]] pour le module d'​import XML/w+CSV   * **txm-filter-teifrantext-xmlw.xsl** : conversion préalable des fichiers XML de la base [[http://​www.cnrtl.fr/​corpus/​frantext|Frantext libre]] pour le module d'​import XML/w+CSV
 +
 +===== Feuilles nécessaires au fonctionnement de TXM =====
 +
 +Vous pouvez les utiliser librement, mais vous devez pas les modifier ou supprimer !
 +
 +  * **dossier "​tei"​** : librairie de feuilles de style mise à disposition par la TEI (cf. [[http://​www.tei-c.org/​Tools/​Stylesheets]]). Elle est utilisée pour l'​importation de documents ODT.
 +
 +
 +  * **breakByMilestone.xsl** : extrait le contenu d'un document XML situé entre deux balises <​tei:​pb/>​ dont les numéros sont fournis en tant que paramètres et de l'​enrgistrer comme document XML bien formé. Utilisée par le module d'​import Transcriber + CSV
 +  * **concordance_mot-pivot.xsl** : génère une concordance syntaxique "​mot-pivot"​ (liée à la fonctionnalité Tiger du portail TXM)
 +  * **concordance_simple.xsl** : génère une concordance syntaxique "​simple"​ (liée à la fonctionnalité Tiger du portail TXM)
 +  * **identity.xsl** : copie le document XML à l'​identique (en s'​assurant de la bonne formation et en tenant compte du schéma ou de la DTD éventuels)
 +  * **svn2cl** : convertit un log svn xml en changelog standard ​
  
public/xsl.1386437436.txt.gz · Dernière modification: 2013/12/07 18:30 par slh@ens-lyon.fr