Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

public:xsl [2015/02/19 15:29]
alexei.lavrentev@ens-lyon.fr
public:xsl [2017/10/04 16:15] (version actuelle)
alexei.lavrentev@ens-lyon.fr
Ligne 11: Ligne 11:
  * les auteurs et les licences de diffusion des feuilles XSL sont indiqués au sein de chaque feuille.   * les auteurs et les licences de diffusion des feuilles XSL sont indiqués au sein de chaque feuille.
-===== Feuilles génériques élémentaires de filtrage de sources XML =====+ 
 +===== Feuilles de style destinées à l'usage avec le module d'import XTZ+CSV ===== 
 + 
 +==== 1-split-merge step ==== 
 + 
 +=== txm-rename-files-no-dots.xsl === 
 +This stylesheet is designed for TXM XTZ+CSV import module to replace dots with underscores in source file names. (A bug in TXM 0.7.8 prevents 
 +files containing dots in their names from being imported). 
 + 
 +=== txm-split-teicorpus.xsl === 
 +This stylesheet may be used to split a single file containing a teiCorpus into individual files for each TEI child. 
 + 
 +==== 2-front step ==== 
 + 
 +=== txm-front-teiHeader2textAtt.xsl === 
 + 
 +This stylesheet may be customized to extract metadata from teiHeader and create corresponding attributes of the text element. 
 + 
 +==== 3-posttok step ==== 
 + 
 +=== txm-posttok-addRef.xsl === 
 + 
 +This stylesheet may be customized to add a ref attribute du w elements which will be used as a default reference in TXM concordances. 
 + 
 +=== txm-posttok-unbreakWords.xsl === 
 + 
 +This stylesheet may be customized to re-unite the words broken in the primary tokenization process (due to line or page breaks, for instance) 
 + 
 +==== 4-edition step ==== 
 + 
 +=== 1-default-html.xsl === 
 + 
 +This is an alternative stylesheet for creating default editions with the XTZ module. It transforms every TEI element into an HTML span with @class. This stylesheet must be used in conjunction with 2-default-pager.xsl. 
 + 
 +=== 2-defaut-pager.xsl === 
 + 
 +This stylesheet should be used in conjunction with 1-default-html.xsl to create edition pages. 
 + 
 + 
 +===== Feuilles génériques élémentaires de traitement de sources XML =====
  * **filter-keep-only-select.xsl** : cette feuille de transformation supprime le contenu de tous les éléments XML à l'exception de <select> et de ses descendants (voir la ligne 43). Si le document ne contient pas de balise <select>, aucune modification n'est effectuée. Elle peut être adaptée et utilisée avec le module d'import XML/w+CSV pour limiter le corpus aux éléments préannotés ;   * **filter-keep-only-select.xsl** : cette feuille de transformation supprime le contenu de tous les éléments XML à l'exception de <select> et de ses descendants (voir la ligne 43). Si le document ne contient pas de balise <select>, aucune modification n'est effectuée. Elle peut être adaptée et utilisée avec le module d'import XML/w+CSV pour limiter le corpus aux éléments préannotés ;
  * **filter-out-p.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <p> ayant un attribut 'type' à la valeur 'ouverture' (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'import XML/w+CSV pour filtrer le contenu de différentes balises XML à la volée ;   * **filter-out-p.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <p> ayant un attribut 'type' à la valeur 'ouverture' (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'import XML/w+CSV pour filtrer le contenu de différentes balises XML à la volée ;
  * **filter-out-sp.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <sp> ayant un attribut 'who' à la valeur 'enqueteur' (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'import Transcriber+CSV pour filtrer les prises de tour de différents locuteurs à la volée.   * **filter-out-sp.xsl** : cette feuille de transformation supprime le contenu de tous les éléments <sp> ayant un attribut 'who' à la valeur 'enqueteur' (voir la ligne 42). Elle peut être adaptée et utilisée avec le module d'import Transcriber+CSV pour filtrer les prises de tour de différents locuteurs à la volée.
 +  * **filter-number-act-scene-line.xsl** : cette feuille de transformation numérote tous les actes, scènes et lignes de l'édition XML de la pièce All's Well That Ends Well de William Shakespeare publiée en ligne [[https://www.ibiblio.org/xml/examples/shakespeare/all_well.xml]].
 +    * Elle peut être utilisée avec le module d'import XML/w+CSV pour numéroter à la volée lors de l'import. **Attention** : le pré-traitement XSL est plus strict (moins permissif) que le reste du module XML/w+CSV. Il faudra donc au préalable déposer dans le répertoire contenant la pièce le fichier de DTD correspondant disponible en ligne [[http://www.ibiblio.org/xml/examples/play.dtd]].
 +    * Elle peut également être appliquée de façon définitive sur la pièce au préalable, avant import, avec l'aide de la macro [[public:macros#execxsl|ExecXSL]].
===== Feuilles génériques d'adaptation de sources XML-TEI P5 ===== ===== Feuilles génériques d'adaptation de sources XML-TEI P5 =====
Ligne 29: Ligne 71:
       * copyAll : liste des balises à conserver, les noms des balises sont séparés pas des barres verticales (ab|body|div|front|head|lb|p|pb|s|TEI|text|w par défaut) ;        * copyAll : liste des balises à conserver, les noms des balises sont séparés pas des barres verticales (ab|body|div|front|head|lb|p|pb|s|TEI|text|w par défaut) ;
    * Toutes les autres balises sont supprimées, leur contenu textuel est en revanche conservé.     * Toutes les autres balises sont supprimées, leur contenu textuel est en revanche conservé.
 +  * **txm-filter-bnc_oral-xmlw.xsl** : adapte les transcriptions de l'oral du BNC pour un traitement dans TXM.
 +    * Projete dans des attributs de balise <div> le contenu de certaines métadonnées du teiHeader (pour faciliter les contrastes internes entre types d'activités) :
 +      * titleStmt/title
 +      * profileDesc/creation
 +      * classCode[@scheme='DLEE']
 +      * setting/placeName
 +      * setting/locale
 +      * setting/activity
 +      * setting/activity/@spont
 +      * recording/@date ou profileDesc/creation
 +    * Projete dans des attributs de balise <u> le contenu de certaines métadonnées du teiHeader (pour faciliter les contrastes internes entre types de locuteurs) :
 +      * profileDesc/particDesc/person[...]/@*
===== Feuilles spécialisées pour traiter un corpus particulier ===== ===== Feuilles spécialisées pour traiter un corpus particulier =====
public/xsl.1424356146.txt.gz · Dernière modification: 2015/02/19 15:29 par alexei.lavrentev@ens-lyon.fr