Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.
public:xsl [2015/12/21 10:09] slh@ens-lyon.fr |
public:xsl [2017/10/04 16:15] (version actuelle) alexei.lavrentev@ens-lyon.fr |
||
---|---|---|---|
Ligne 10: | Ligne 10: | ||
* le nom des feuilles XSL obéit en général au format suivant 'txm-filter-[format d'entrée]-[module d'import](-[option])?' ; | * le nom des feuilles XSL obéit en général au format suivant 'txm-filter-[format d'entrée]-[module d'import](-[option])?' ; | ||
* les auteurs et les licences de diffusion des feuilles XSL sont indiqués au sein de chaque feuille. | * les auteurs et les licences de diffusion des feuilles XSL sont indiqués au sein de chaque feuille. | ||
+ | |||
+ | |||
+ | ===== Feuilles de style destinées à l'usage avec le module d'import XTZ+CSV ===== | ||
+ | |||
+ | ==== 1-split-merge step ==== | ||
+ | |||
+ | === txm-rename-files-no-dots.xsl === | ||
+ | This stylesheet is designed for TXM XTZ+CSV import module to replace dots with underscores in source file names. (A bug in TXM 0.7.8 prevents | ||
+ | files containing dots in their names from being imported). | ||
+ | |||
+ | === txm-split-teicorpus.xsl === | ||
+ | This stylesheet may be used to split a single file containing a teiCorpus into individual files for each TEI child. | ||
+ | |||
+ | ==== 2-front step ==== | ||
+ | |||
+ | === txm-front-teiHeader2textAtt.xsl === | ||
+ | |||
+ | This stylesheet may be customized to extract metadata from teiHeader and create corresponding attributes of the text element. | ||
+ | |||
+ | ==== 3-posttok step ==== | ||
+ | |||
+ | === txm-posttok-addRef.xsl === | ||
+ | |||
+ | This stylesheet may be customized to add a ref attribute du w elements which will be used as a default reference in TXM concordances. | ||
+ | |||
+ | === txm-posttok-unbreakWords.xsl === | ||
+ | |||
+ | This stylesheet may be customized to re-unite the words broken in the primary tokenization process (due to line or page breaks, for instance) | ||
+ | |||
+ | ==== 4-edition step ==== | ||
+ | |||
+ | === 1-default-html.xsl === | ||
+ | |||
+ | This is an alternative stylesheet for creating default editions with the XTZ module. It transforms every TEI element into an HTML span with @class. This stylesheet must be used in conjunction with 2-default-pager.xsl. | ||
+ | |||
+ | === 2-defaut-pager.xsl === | ||
+ | |||
+ | This stylesheet should be used in conjunction with 1-default-html.xsl to create edition pages. | ||
+ | |||
===== Feuilles génériques élémentaires de traitement de sources XML ===== | ===== Feuilles génériques élémentaires de traitement de sources XML ===== | ||
Ligne 32: | Ligne 71: | ||
* copyAll : liste des balises à conserver, les noms des balises sont séparés pas des barres verticales (ab|body|div|front|head|lb|p|pb|s|TEI|text|w par défaut) ; | * copyAll : liste des balises à conserver, les noms des balises sont séparés pas des barres verticales (ab|body|div|front|head|lb|p|pb|s|TEI|text|w par défaut) ; | ||
* Toutes les autres balises sont supprimées, leur contenu textuel est en revanche conservé. | * Toutes les autres balises sont supprimées, leur contenu textuel est en revanche conservé. | ||
+ | * **txm-filter-bnc_oral-xmlw.xsl** : adapte les transcriptions de l'oral du BNC pour un traitement dans TXM. | ||
+ | * Projete dans des attributs de balise <div> le contenu de certaines métadonnées du teiHeader (pour faciliter les contrastes internes entre types d'activités) : | ||
+ | * titleStmt/title | ||
+ | * profileDesc/creation | ||
+ | * classCode[@scheme='DLEE'] | ||
+ | * setting/placeName | ||
+ | * setting/locale | ||
+ | * setting/activity | ||
+ | * setting/activity/@spont | ||
+ | * recording/@date ou profileDesc/creation | ||
+ | * Projete dans des attributs de balise <u> le contenu de certaines métadonnées du teiHeader (pour faciliter les contrastes internes entre types de locuteurs) : | ||
+ | * profileDesc/particDesc/person[...]/@* | ||
===== Feuilles spécialisées pour traiter un corpus particulier ===== | ===== Feuilles spécialisées pour traiter un corpus particulier ===== |