Outils pour utilisateurs

Outils du site


public:xsl

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:xsl [2015/02/19 15:27]
alexei.lavrentev@ens-lyon.fr
public:xsl [2019/07/10 10:02] (Version actuelle)
alexei.lavrentev@ens-lyon.fr [2-front step]
Ligne 11: Ligne 11:
   * les auteurs et les licences de diffusion des feuilles XSL sont indiqués au sein de chaque feuille.   * les auteurs et les licences de diffusion des feuilles XSL sont indiqués au sein de chaque feuille.
  
-===== Feuilles génériques élémentaires de filtrage ​de sources XML =====+ 
 +===== Feuilles de style destinées à l'​usage avec le module d'​import XTZ+CSV ===== 
 + 
 +==== 1-split-merge step ==== 
 + 
 +=== txm-rename-files-no-dots.xsl === 
 +This stylesheet is designed for TXM XTZ+CSV import module to replace dots with underscores in source file names. (A bug in TXM 0.7.8 prevents 
 +files containing dots in their names from being imported). 
 + 
 +=== txm-split-teicorpus.xsl === 
 +This stylesheet may be used to split a single file containing a teiCorpus into individual files for each TEI child. 
 + 
 +==== 2-front step ==== 
 + 
 +=== txm-front-teiHeader2textAtt.xsl === 
 + 
 +This stylesheet may be customized to extract metadata from teiHeader and create corresponding attributes of the text element. 
 + 
 +=== txm-front-teitxm2xmlw.xsl === 
 + 
 +This stylesheet may be used to import TEI-TXM XML files with XML-TEI Zero+CSV (or XML/W + CSV) module. This module is more flexible than XML-TEI TXM. It allows re-tokenizing the texts, selecting and renaming annotations,​ and building synoptic editions. 
 + 
 +==== 3-posttok step ==== 
 + 
 +=== txm-posttok-addRef.xsl === 
 + 
 +This stylesheet may be customized to add a ref attribute du w elements which will be used as a default reference in TXM concordances. 
 + 
 +=== txm-posttok-unbreakWords.xsl === 
 + 
 +This stylesheet may be customized to re-unite the words broken in the primary tokenization process (due to line or page breaks, for instance) 
 + 
 +==== 4-edition step ==== 
 + 
 +=== 1-default-html.xsl === 
 + 
 +This is an alternative stylesheet for creating default editions with the XTZ module. It transforms every TEI element into an HTML span with @class. This stylesheet must be used in conjunction with 2-default-pager.xsl. 
 + 
 +=== 2-defaut-pager.xsl === 
 + 
 +This stylesheet should be used in conjunction with 1-default-html.xsl to create edition pages. 
 + 
 + 
 +===== Feuilles génériques élémentaires de traitement ​de sources XML =====
  
   * **filter-keep-only-select.xsl** : cette feuille de transformation supprime le contenu de tous les éléments XML à l'​exception de <​select>​ et de ses descendants (voir la ligne 43). Si le document ne contient pas de balise <​select>,​ aucune modification n'est effectuée. Elle peut être adaptée et utilisée avec le module d'​import XML/w+CSV pour limiter le corpus aux éléments préannotés ;   * **filter-keep-only-select.xsl** : cette feuille de transformation supprime le contenu de tous les éléments XML à l'​exception de <​select>​ et de ses descendants (voir la ligne 43). Si le document ne contient pas de balise <​select>,​ aucune modification n'est effectuée. Elle peut être adaptée et utilisée avec le module d'​import XML/w+CSV pour limiter le corpus aux éléments préannotés ;
   * **filter-out-p.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <p> ayant un attribut '​type'​ à la valeur '​ouverture'​ (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'​import XML/w+CSV pour filtrer le contenu de différentes balises XML à la volée ;   * **filter-out-p.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <p> ayant un attribut '​type'​ à la valeur '​ouverture'​ (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'​import XML/w+CSV pour filtrer le contenu de différentes balises XML à la volée ;
   * **filter-out-sp.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <sp> ayant un attribut '​who'​ à la valeur '​enqueteur'​ (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'​import Transcriber+CSV pour filtrer les prises de tour de différents locuteurs à la volée.   * **filter-out-sp.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <sp> ayant un attribut '​who'​ à la valeur '​enqueteur'​ (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'​import Transcriber+CSV pour filtrer les prises de tour de différents locuteurs à la volée.
 +  * **filter-number-act-scene-line.xsl** : cette feuille de transformation numérote tous les actes, scènes et lignes de l'​édition XML de la pièce All's Well That Ends Well de William Shakespeare publiée en ligne [[https://​www.ibiblio.org/​xml/​examples/​shakespeare/​all_well.xml]].
 +    * Elle peut être utilisée avec le module d'​import XML/w+CSV pour numéroter à la volée lors de l'​import. **Attention** : le pré-traitement XSL est plus strict (moins permissif) que le reste du module XML/w+CSV. Il faudra donc au préalable déposer dans le répertoire contenant la pièce le fichier de DTD correspondant disponible en ligne [[http://​www.ibiblio.org/​xml/​examples/​play.dtd]].
 +    * Elle peut également être appliquée de façon définitive sur la pièce au préalable, avant import, avec l'aide de la macro [[public:​macros#​execxsl|ExecXSL]].
  
 ===== Feuilles génériques d'​adaptation de sources XML-TEI P5 ===== ===== Feuilles génériques d'​adaptation de sources XML-TEI P5 =====
Ligne 29: Ligne 75:
        * copyAll : liste des balises à conserver, les noms des balises sont séparés pas des barres verticales (ab|body|div|front|head|lb|p|pb|s|TEI|text|w par défaut) ;        * copyAll : liste des balises à conserver, les noms des balises sont séparés pas des barres verticales (ab|body|div|front|head|lb|p|pb|s|TEI|text|w par défaut) ;
     * Toutes les autres balises sont supprimées,​ leur contenu textuel est en revanche conservé.     * Toutes les autres balises sont supprimées,​ leur contenu textuel est en revanche conservé.
 +  * **txm-filter-bnc_oral-xmlw.xsl** : adapte les transcriptions de l'oral du BNC pour un traitement dans TXM.
 +    * Projete dans des attributs de balise <div> le contenu de certaines métadonnées du teiHeader (pour faciliter les contrastes internes entre types d'​activités) :
 +      * titleStmt/​title
 +      * profileDesc/​creation
 +      * classCode[@scheme='​DLEE'​]
 +      * setting/​placeName
 +      * setting/​locale
 +      * setting/​activity
 +      * setting/​activity/​@spont
 +      * recording/​@date ou profileDesc/​creation
 +    * Projete dans des attributs de balise <u> le contenu de certaines métadonnées du teiHeader (pour faciliter les contrastes internes entre types de locuteurs) :
 +      * profileDesc/​particDesc/​person[...]/​@*
  
 ===== Feuilles spécialisées pour traiter un corpus particulier ===== ===== Feuilles spécialisées pour traiter un corpus particulier =====
Ligne 44: Ligne 102:
  
  
-  * **breakByMilestone.xsl"" ​: extrait le contenu d'un document XML situé entre deux balises <​tei:​pb/>​ dont les numéros sont fournis en tant que paramètres et de l'​enrgistrer comme document XML bien formé. Utilisée par le module d'​import Transcriber + CSV+  * **breakByMilestone.xsl** : extrait le contenu d'un document XML situé entre deux balises <​tei:​pb/>​ dont les numéros sont fournis en tant que paramètres et de l'​enrgistrer comme document XML bien formé. Utilisée par le module d'​import Transcriber + CSV
   * **concordance_mot-pivot.xsl** : génère une concordance syntaxique "​mot-pivot"​ (liée à la fonctionnalité Tiger du portail TXM)   * **concordance_mot-pivot.xsl** : génère une concordance syntaxique "​mot-pivot"​ (liée à la fonctionnalité Tiger du portail TXM)
   * **concordance_simple.xsl** : génère une concordance syntaxique "​simple"​ (liée à la fonctionnalité Tiger du portail TXM)   * **concordance_simple.xsl** : génère une concordance syntaxique "​simple"​ (liée à la fonctionnalité Tiger du portail TXM)
   * **identity.xsl** : copie le document XML à l'​identique (en s'​assurant de la bonne formation et en tenant compte du schéma ou de la DTD éventuels)   * **identity.xsl** : copie le document XML à l'​identique (en s'​assurant de la bonne formation et en tenant compte du schéma ou de la DTD éventuels)
-  * **svn2cl** : convertit ​le log svn xml en changelog standard ​+  * **svn2cl** : convertit ​un log svn xml en changelog standard ​
  
public/xsl.1424356038.txt.gz · Dernière modification: 2015/02/19 15:27 par alexei.lavrentev@ens-lyon.fr