Outils pour utilisateurs

Outils du site


public:specs_production_projet_oriflamms

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
public:specs_production_projet_oriflamms [2016/01/08 16:34]
slh@ens-lyon.fr
public:specs_production_projet_oriflamms [2016/06/23 11:41] (Version actuelle)
matthieu.decorde@ens-lyon.fr
Ligne 45: Ligne 45:
   - Insertion des milestones manquants (milestone[@unit="​surface"​] pour chaque image, cb et lb systématiques) (XSLT patch : **oriflamms-patch-milestones.xsl**) -> %%/​texts/​corpus-w.xml%%   - Insertion des milestones manquants (milestone[@unit="​surface"​] pour chaque image, cb et lb systématiques) (XSLT patch : **oriflamms-patch-milestones.xsl**) -> %%/​texts/​corpus-w.xml%%
   - Tokenisation par mot (XSLT simple : **oriflamms-tokenize-words.xsl**) -> %%/​texts/​corpus-w.xml%%   - Tokenisation par mot (XSLT simple : **oriflamms-tokenize-words.xsl**) -> %%/​texts/​corpus-w.xml%%
-  - Re-tokenisation avec regexp (Groovy patch) -> %%/​texts/​corpus-w.xml%%<​code></​w><​w[^>​]*>​ --> (rien)+  - Re-tokenisation avec regexp (Groovy patch) -> %%/​texts/​corpus-w.xml%%<​code></​w><​w[^>]*)?> --> (rien)
 </​w>​\s*(<​milestone[^>​]*>​)?​\s*(<​pb[^>​]*>​)?​\s*(<​cb[^>​]*>​)?​\s*(<​lb[^>​]*break="​no"​[^>​]*>​)\s*<​w[^>​]*> ​ --> $1$2$3$4</​code>​ </​w>​\s*(<​milestone[^>​]*>​)?​\s*(<​pb[^>​]*>​)?​\s*(<​cb[^>​]*>​)?​\s*(<​lb[^>​]*break="​no"​[^>​]*>​)\s*<​w[^>​]*> ​ --> $1$2$3$4</​code>​
   - Balisage des parties de mots coupés par des sauts de ligne, etc. ; suppression des balises <w> et <pc> imbriquées (XSLT patch : **oriflamms-patch-words-with-lb.xsl**)   - Balisage des parties de mots coupés par des sauts de ligne, etc. ; suppression des balises <w> et <pc> imbriquées (XSLT patch : **oriflamms-patch-words-with-lb.xsl**)
Ligne 68: Ligne 68:
           * N = compteur de 1 à n à partir du pb précédent           * N = compteur de 1 à n à partir du pb précédent
         * si absent, ajouter @n (comptage de 1 à n à partir du pb précédent)         * si absent, ajouter @n (comptage de 1 à n à partir du pb précédent)
-      * lb +      * lb   ​ 
-        * si absent, ajouter %%@xml:id="line_$colID_$Nlb"%% où  +        * si absent, ajouter %%@n="$NCurentLine"%% où 
-          * colID = identifiant du cb précédent **sans le préfixe "​col_"​** +          * NCurentLine se remet à 1 à chaque ​cb 
-          * Nlb = compteur de 1 à n à partir du cb précédent (avec et sans @type="​rejet"​) +          * si type="​rejet", ​afficher warning "​no ​attribute provided for '​rejet'​ line break
-        * si not(@type="​rejet"​+        * si @n a une valeur non numérique (par ex. "​3bis",​ "​r"​),​ l'​attribut est copié dans la sortie, NCurrentLine n'est pas incrémenté 
-          * si absentajouter %%@n="$NCurentLine"​%% où +        sinon NCurentLine prend sa valeur
-            * NCurentLine se remet à 1 à chaque cb +
-            ​* si un lb[not([type="​rejet"​)] a un @n à valeur non numérique (par ex. "​3bis",​ "​r"​),​ l'​attribut est copié dans la sortie, NCurrentLine n'est pas incrémenté +
-            si un lb[not([type="​rejet"​)] a un @n à valeur numérique, ​NCurentLine prend sa valeur ​et est incrémenté à chaque nouveau lb[not(@type="​rejet"​)]+
         * si @type="​rejet"​         * si @type="​rejet"​
-          * si pas de @n --> on met un warning ​"no n attribute provided for '​rejet'​ line break" ​et on prend le @n du premier ​lb suivant+          * si absent, ajouter %%@xml:id="line_$colID_$Nlb_r$Nrejet"%%, où 
 +            * colID = identifiant du cb précédent **sans ​le préfixe "​col_"​** 
 +            * Nlb = valeur de l'​attribut ​@n 
 +            * Nrejet = compteur des lb[@type="​rejet"​] (se remet à 1 à chaque cb)
           * si absent, ajouter %%@corresp="#​$correspLineID"​%% où           * si absent, ajouter %%@corresp="#​$correspLineID"​%% où
-          ​* correspLineID = %%@xml:​id="​line_$colID_$(Nlb+1)"​%% ​+            ​* correspLineID = %%line_$colID_$Nlb%% (soit @xml:id sans le suffixe "​_r[0-9]+"​) 
 +        * sinon 
 +          * si absent, ajouter ​%%@xml:​id="​line_$colID_$Nlb"​%% ​où  
 +            * colID = identifiant du cb précédent **sans le préfixe "​col_"​** 
 +            * Nlb = compteur de 1 à n à partir du cb précédent (<​del>​avec et </​del>​sans @type="​rejet"​)
       * w       * w
         * si absent, ajouter %%@xml:​id="​w_$corpusID_$N"​%% où          * si absent, ajouter %%@xml:​id="​w_$corpusID_$N"​%% où 
Ligne 109: Ligne 113:
  
 ===== Recette ===== ===== Recette =====
-==== Protocole de test ==== 
-=== Alpha === 
  
-== Installation de TXM == 
- 
-  * Installer TXM 0.7.7 à partir de [[http://​perso.ens-lyon.fr/​serge.heiden/​txm/​files/​software/​TXM/​0.7.7/​]] 
-  * Installer une mise à jour 0.7.8 Alpha Oriflamms : 
-    * télécharger l'​archive [[https://​goo.gl/​3gVsgt]] 
-    * décompresser le contenu de l'​archive 
-    * dans TXM, utiliser le menu Fichier / Ajouter une extension tierce 
-    * Cliquer sur Ajouter... 
-    * Cliquer sur Local 
-    * Sélectionner le dossier "MAJ TXM 0.7.8 alpha Oriflamm"​ créé lors de la décompression de l'​archive 
-    * Décocher la case "​Grouper par catégorie"​ 
-    * Sélectionner tout et suivre les instructions de l'​assistant 
-  * Installer le paquet de macros Oriflamms 
-    * télécharger l'​archive [[https://​goo.gl/​219Vqh]] 
-    * décompresser le contenu de l'​archive 
-    * copier le dossier "​oriflamms"​ dans %%$USERDIR/​TXM/​scripts/​macro/​org/​txm/​macro%% 
-  * Dans TXM, ouvrir la Vue Macro 
-    * Menu Affichage --> Vues --> Macro 
-    * Un onglet Macro s'​ouvre au-dessous de la liste des corpus 
-  * Si aucune macro ne s'​affiche dans l'​onglet,​ cliquer sur le bouton "​Rafraichir"​ 
-  * Dans l'​onglet,​ double-cliquer sur "​oriflamms",​ puis "​prepare",​ puis "​TEI2Project"​ 
-    * indiquer le document TEI à traiter, la feuille XSLT de pré-traitement (optionnelle,​ mais presque toujours indispensable) et le chemin vers le dossier d'​image (optionnel) 
-    * cliquer sur "​Exécution"​ 
- 
-à compléter... 
- 
-=== Beta === 
  
 ==== État courant ==== ==== État courant ====
 Qui Quand Quoi Qui Quand Quoi
  
public/specs_production_projet_oriflamms.1452267240.txt.gz · Dernière modification: 2016/01/08 16:34 par slh@ens-lyon.fr